Un modelo de lenguaje grande (LLM) es un tipo de modelo de aprendizaje automático que puede manejar una amplia gama de casos de uso de procesamiento de lenguaje natural (NLP). Pero debido a su versatilidad, los LLM pueden ser un poco abrumadores para los recién llegados que intentan comprender cuándo y dónde usar estos modelos.
En esta serie de blogs, simplificaremos los LLM mediante el mapeo de las siete amplias categorías de casos de uso donde puede aplicarlos, con ejemplos de la plataforma LLM de Cohere. Con suerte, esto puede servir como punto de partida a medida que comienza a trabajar con la API de Cohere , o incluso generar algunas ideas para lo siguiente que desea construir.
Las siete categorías de casos de uso son:
- Generar
- Resumir
- Volver a escribir
- Extracto
- Búsqueda/similitud
- Grupo
- Clasificar
Debido a la naturaleza de propósito general de los LLM, la gama de casos de uso y las industrias relevantes dentro de cada categoría es extremadamente amplia. Esta publicación no intentará profundizar demasiado en cada uno, pero le proporcionará suficientes ideas y ejemplos para ayudarlo a comenzar a experimentar.
1. Generar
Probablemente lo primero que viene a la mente cuando se habla de LLM es su capacidad para generar textos originales y coherentes. Y de eso se trata esta categoría de caso de uso. Los LLM se entrenan previamente utilizando una gran colección de texto recopilado de una variedad de fuentes. Esto significa que pueden capturar los patrones de cómo se usa el lenguaje y cómo escriben los humanos.
Obtener lo mejor de estos modelos de generación se está convirtiendo en todo un campo de estudio en sí mismo llamado ingeniería rápida . De hecho, las primeras cuatro categorías de casos de uso de nuestra lista aprovechan la generación de avisos a su manera.
Más sobre los otros tres más adelante, pero la idea básica en la ingeniería rápida es proporcionar un contexto para que funcione un modelo. La ingeniería rápida es un tema amplio, pero a un nivel muy alto, la idea es proporcionar un modelo con una pequeña cantidad de información contextual como una pista para generar una secuencia específica de texto.
Una forma de establecer el contexto es escribir unas pocas líneas de un pasaje para que el modelo continúe. Imagine escribir un ensayo o una copia de marketing donde comenzaría con las primeras oraciones sobre un tema y luego haría que el modelo complete el párrafo o incluso todo el artículo.
Otra forma es escribiendo algunos patrones de ejemplo que indiquen el tipo de texto que queremos que genere el modelo. Este es interesante debido a las diferentes formas en que podemos dar forma a los modelos y las diversas aplicaciones que conlleva.
Tomemos un ejemplo. El objetivo aquí es que el modelo genere el primer párrafo de una publicación de blog. Primero, preparamos una breve línea de contexto sobre lo que nos gustaría que escribiera el modelo. Luego, preparamos dos ejemplos, cada uno con el título del blog, su audiencia, el tono de voz y el párrafo correspondiente.
Finalmente, alimentamos el modelo con este indicador, junto con la información para el nuevo blog. Y el modelo generará debidamente el texto que coincida con el contexto, como se ve a continuación.
Terminación:
Puede probarlo accediendo al preset guardado .
De hecho, el extracto que leíste al comienzo de este blog se generó con este ajuste preestablecido.
Ese fue solo un ejemplo, pero la forma en que impulsamos un modelo está limitada solo por nuestra creatividad. Aquí hay algunos otros ejemplos:
- Escribir descripciones de productos, dado el nombre del producto y las palabras clave.
- Escribir respuestas de chatbot/IA conversacional
- Desarrollo de una interfaz de preguntas y respuestas
- Escribir correos electrónicos, dado el propósito/comando
- Redacción de títulos y párrafos.
2. Resumir
La segunda categoría de casos de uso, que también aprovecha la ingeniería rápida, es el resumen de texto. Piense en la cantidad de texto con el que tratamos en un día típico, como informes, artículos, notas de reuniones, correos electrónicos, transcripciones, etc. Podemos hacer que un LLM resuma un fragmento de texto solicitándolo con algunos ejemplos de un documento completo y su resumen.
El siguiente es un ejemplo de resumen de artículo, donde preparamos el aviso para que contenga el pasaje completo de un artículo y su resumen de una línea.
Inmediato:
Terminación:
Puede probarlo accediendo al preset guardado .
Aquí hay algunos otros documentos de ejemplo donde el resumen de LLM será útil:
- Chats de atención al cliente
- Informes ambientales, sociales y de gobierno corporativo (ESG)
- Llamadas de ganancias
- resúmenes de papel
- Diálogos y transcripciones
3. Reescribir
Otro sabor de la ingeniería rápida es la reescritura de texto. Esta es otra de esas tareas que hacemos todos los días y en las que dedicamos mucho tiempo, y si pudiéramos automatizarlas, nos liberaría para trabajar en tareas más creativas.
La reescritura de texto puede significar diferentes cosas y tomar diferentes formas, pero un ejemplo común es la corrección de texto. La siguiente es la tarea de corregir la ortografía y la gramática en las transcripciones de voz a texto. Preparamos el mensaje con un poco de contexto sobre la tarea, seguido de ejemplos de transcripciones incorrectas y corregidas.
Inmediato:
Terminación:
Puede probarlo accediendo al preset guardado .
Aquí hay algunos otros casos de uso de ejemplo para usar un LLM para reescribir texto:
- Parafrasear un fragmento de texto con una voz diferente
- Cree un corrector ortográfico que corrija las mayúsculas del texto
- Reformular las respuestas del chatbot
- Redactar información de identificación personal
- Convierta una pieza de texto compleja en una forma digerible
4. Extracto
La extracción de texto es otra categoría de casos de uso que puede aprovechar un LLM de generación. La idea es tomar un texto largo y extraer solo la información clave o las palabras del texto.
La siguiente es la tarea de extraer información relevante de los contratos. Preparamos el aviso con un poco de contexto sobre la tarea, seguido de un par de contratos de ejemplo y el texto extraído.
Inmediato:
Terminación:
Puede probarlo accediendo al preset guardado .
Algunos otros casos de uso en esta categoría incluyen:
- Extraer entidades nombradas de un documento
- Extraiga palabras clave y frases clave de artículos
- Marcar para información de identificación personal
- Extraer proveedor y términos del contrato
- Crear etiquetas para blogs
Conclusión
En la segunda parte de esta serie , continuaremos nuestra exploración de las tres categorías de casos de uso restantes (Búsqueda/similitud, agrupación y clasificación). También exploraremos cómo las API LLM pueden ayudar a abordar casos de uso más complejos. El mundo es complejo y muchos problemas solo se pueden abordar juntando varios modelos de PNL. Veremos algunos ejemplos de cómo podemos unir rápidamente una combinación de puntos finales de API para crear soluciones más completas.
0 comentarios:
Publicar un comentario