18 febrero 2023

Large Language Models and Where to Use Them

Articulo Original:

Un modelo de lenguaje grande (LLM) es un tipo de modelo de aprendizaje automático que puede manejar una amplia gama de casos de uso de procesamiento de lenguaje natural (NLP). Pero debido a su versatilidad, los LLM pueden ser un poco abrumadores para los recién llegados que intentan comprender cuándo y dónde usar estos modelos.

En esta serie de blogs, simplificaremos los LLM mediante el mapeo de las siete amplias categorías de casos de uso donde puede aplicarlos, con ejemplos de la plataforma LLM de Cohere. Con suerte, esto puede servir como punto de partida a medida que comienza a trabajar con la API de Cohere , o incluso generar algunas ideas para lo siguiente que desea construir.

Las siete categorías de casos de uso son:

  1. Generar
  2. Resumir
  3. Volver a escribir
  4. Extracto
  5. Búsqueda/similitud
  6. Grupo
  7. Clasificar

Debido a la naturaleza de propósito general de los LLM, la gama de casos de uso y las industrias relevantes dentro de cada categoría es extremadamente amplia. Esta publicación no intentará profundizar demasiado en cada uno, pero le proporcionará suficientes ideas y ejemplos para ayudarlo a comenzar a experimentar.


1. Generar

Generar

Probablemente lo primero que viene a la mente cuando se habla de LLM es su capacidad para generar textos originales y coherentes. Y de eso se trata esta categoría de caso de uso. Los LLM se entrenan previamente utilizando una gran colección de texto recopilado de una variedad de fuentes. Esto significa que pueden capturar los patrones de cómo se usa el lenguaje y cómo escriben los humanos.

Obtener lo mejor de estos modelos de generación se está convirtiendo en todo un campo de estudio en sí mismo llamado ingeniería rápida . De hecho, las primeras cuatro categorías de casos de uso de nuestra lista aprovechan la generación de avisos a su manera.

Más sobre los otros tres más adelante, pero la idea básica en la ingeniería rápida es proporcionar un contexto para que funcione un modelo. La ingeniería rápida es un tema amplio, pero a un nivel muy alto, la idea es proporcionar un modelo con una pequeña cantidad de información contextual como una pista para generar una secuencia específica de texto.

Una forma de establecer el contexto es escribir unas pocas líneas de un pasaje para que el modelo continúe. Imagine escribir un ensayo o una copia de marketing donde comenzaría con las primeras oraciones sobre un tema y luego haría que el modelo complete el párrafo o incluso todo el artículo.

Otra forma es escribiendo algunos patrones de ejemplo que indiquen el tipo de texto que queremos que genere el modelo. Este es interesante debido a las diferentes formas en que podemos dar forma a los modelos y las diversas aplicaciones que conlleva.

Tomemos un ejemplo. El objetivo aquí es que el modelo genere el primer párrafo de una publicación de blog. Primero, preparamos una breve línea de contexto sobre lo que nos gustaría que escribiera el modelo. Luego, preparamos dos ejemplos, cada uno con el título del blog, su audiencia, el tono de voz y el párrafo correspondiente.

Finalmente, alimentamos el modelo con este indicador, junto con la información para el nuevo blog. Y el modelo generará debidamente el texto que coincida con el contexto, como se ve a continuación.

Este programa generará un párrafo introductorio para una publicación de blog dado un título de blog, audiencia y tono de voz. -- Título del blog: Las mejores actividades en Toronto Audiencia: Millennials Tono de voz: Alegre Primer párrafo: ¿Busca cosas divertidas para hacer en Toronto? Cuando se trata de explorar la ciudad más grande de Canadá, hay un conjunto de actividades en constante evolución para elegir. Ya sea que esté buscando visitar un museo local o probar la variada cocina de la ciudad, hay mucho para llenar cualquier itinerario. En esta publicación de blog, compartiré algunas de mis recomendaciones favoritas : Título del blog: Dominar la programación dinámica Audiencia: Desarrolladores Tono: Informativo









Primer párrafo: en este artículo, lo ayudaremos a comprender los fundamentos de la programación dinámica y cuándo aplicar esta técnica de optimización. Desglosaremos los enfoques de abajo hacia arriba y de arriba hacia abajo para resolver problemas de programación dinámica. -- Título del blog: Cómo empezar a escalar en roca Audiencia: Atletas Tono: Entusiasta Primer párrafo:





Terminación:

¿Interesado en probar la escalada en roca? Ya sea que sea un principiante o un escalador experimentado, encontrará una gran cantidad de opciones para la excursión de escalada en roca perfecta. En este artículo, compartiré algunos de los mejores lugares para escalar rocas en los Estados Unidos para ayudarlo a planificar su próxima aventura.

Puede probarlo accediendo al preset guardado .

De hecho, el extracto que leíste al comienzo de este blog se generó con este ajuste preestablecido.

Ese fue solo un ejemplo, pero la forma en que impulsamos un modelo está limitada solo por nuestra creatividad. Aquí hay algunos otros ejemplos:

  • Escribir descripciones de productos, dado el nombre del producto y las palabras clave.
  • Escribir respuestas de chatbot/IA conversacional
  • Desarrollo de una interfaz de preguntas y respuestas
  • Escribir correos electrónicos, dado el propósito/comando
  • Redacción de títulos y párrafos.

2. Resumir

Resumir

La segunda categoría de casos de uso, que también aprovecha la ingeniería rápida, es el resumen de texto. Piense en la cantidad de texto con el que tratamos en un día típico, como informes, artículos, notas de reuniones, correos electrónicos, transcripciones, etc. Podemos hacer que un LLM resuma un fragmento de texto solicitándolo con algunos ejemplos de un documento completo y su resumen.

El siguiente es un ejemplo de resumen de artículo, donde preparamos el aviso para que contenga el pasaje completo de un artículo y su resumen de una línea.

Inmediato:

Pasaje: ¿Wordle se está volviendo más difícil de resolver? Los jugadores parecen estar convencidos de que el juego se ha vuelto más difícil en las últimas semanas desde que The New York Times se lo compró al desarrollador Josh Wardle a fines de enero. The Times se ha presentado y compartido que probablemente este no sea el caso. Dicho esto, el NYT se metió un poco con el código de back-end, eliminando algo de lenguaje ofensivo y sexual, así como algunas palabras oscuras. Hay un hilo viral que afirma que estaba en juego un sesgo de confirmación. Un usuario de Twitter llegó a afirmar que el juego ha ido a "la sección polvorienta del diccionario" para encontrar sus últimas palabras. TLDR: Wordle no se ha vuelto más difícil de resolver. --



Passage: ArtificialIvan, una empresa de software de gestión de gastos y pagos con sede en Londres de siete años, ha recaudado 190 millones de dólares en financiación de la Serie C liderada por ARG Global, con la participación de D9 Capital Group y Boulder Capital. Los patrocinadores anteriores también se unieron a la ronda, incluidos Hilton Group, Roxanne Capital, Paved Roads Ventures, Brook Partners y Plato Capital. TLDR: ArtificialIvan ha recaudado $ 190 millones en fondos de la Serie C. -- Pasaje: El Servicio Meteorológico Nacional anunció el martes que una advertencia de congelamiento está vigente para el Área de la Bahía, y se esperan temperaturas bajo cero en estas áreas durante la noche. Las temperaturas podrían caer entre los 20 y los 30 grados en algunas áreas. Anticipándose a las fuertes heladas, el servicio meteorológico advierte a las personas que tomen medidas ahora. TLDR:





Terminación:

Se espera que una fuerte helada golpee el Área de la Bahía esta noche.

Puede probarlo accediendo al preset guardado .

Aquí hay algunos otros documentos de ejemplo donde el resumen de LLM será útil:

  • Chats de atención al cliente
  • Informes ambientales, sociales y de gobierno corporativo (ESG)
  • Llamadas de ganancias
  • resúmenes de papel
  • Diálogos y transcripciones

3. Reescribir

Volver a escribir

Otro sabor de la ingeniería rápida es la reescritura de texto. Esta es otra de esas tareas que hacemos todos los días y en las que dedicamos mucho tiempo, y si pudiéramos automatizarlas, nos liberaría para trabajar en tareas más creativas.

La reescritura de texto puede significar diferentes cosas y tomar diferentes formas, pero un ejemplo común es la corrección de texto. La siguiente es la tarea de corregir la ortografía y la gramática en las transcripciones de voz a texto. Preparamos el mensaje con un poco de contexto sobre la tarea, seguido de ejemplos de transcripciones incorrectas y corregidas.

Inmediato:

Este es un corrector de transcripción de voz a texto. Ante un extracto transcrito con errores, el modelo responde con la versión correcta del extracto. Transcripción incorrecta: Me estoy volviendo loco para leer la tarjeta de crédito faltante del puerto. Perdí la tarjeta cuando lo que hay en el supermercado y necesito que me envíen una nueva. Transcripción correcta: Llamo hoy para informar sobre la falta de una tarjeta de crédito. Perdí mi tarjeta cuando estaba en el supermercado y necesito que me envíen una nueva. -- Transcripción incorrecta: ¿Puede repetir las fechas de las tres y cinco hipotecas fijas caras? Quiero compararlos y ganar las fechas en que otro corredor me cotizó.







Transcripción correcta: ¿Puede repetir las tasas para las hipotecas fijas de tres y cinco años? Quiero compararlos con las tasas que me cotizó otro corredor. -- Transcripción incorrecta: me cobraron intereses en mi tarjeta de crédito, pero pagué mi saldo de extracción un día en la fecha de vencimiento. No me perdí un año de pavimento todavía. Hombre, ¿reviertes el cargo de interés?


Transcripción correcta:

Terminación:

Me cobraron intereses en mi tarjeta de crédito el mes pasado, pero pagué mi saldo en su totalidad en la fecha de vencimiento. Todavía no me he perdido un pago. Tío, ¿reviertes el cargo de interés?

Puede probarlo accediendo al preset guardado .

Aquí hay algunos otros casos de uso de ejemplo para usar un LLM para reescribir texto:

  • Parafrasear un fragmento de texto con una voz diferente
  • Cree un corrector ortográfico que corrija las mayúsculas del texto
  • Reformular las respuestas del chatbot
  • Redactar información de identificación personal
  • Convierta una pieza de texto compleja en una forma digerible

4. Extracto

Extracto

La extracción de texto es otra categoría de casos de uso que puede aprovechar un LLM de generación. La idea es tomar un texto largo y extraer solo la información clave o las palabras del texto.

La siguiente es la tarea de extraer información relevante de los contratos. Preparamos el aviso con un poco de contexto sobre la tarea, seguido de un par de contratos de ejemplo y el texto extraído.

Inmediato:

Este programa extraerá información relevante de los contratos. Estos son algunos ejemplos: Contrato: este acuerdo de marketing de influencers ("Acuerdo") con fecha del 23 de agosto de 2022 (la "Fecha de entrada en vigor") se realiza entre Oren & Co (el "Influencer") y Brand Capital (el " Compañía") con respecto a. La Compañía compensará al Influenciador con cinco mil dólares ($5000.00) por el total de los Servicios prestados. Este Acuerdo entra en vigencia a partir de su firma hasta el 31 de julio de 2023, cuando se carga la publicación final de LinkedIn y se intercambian todos los Servicios y la compensación. Texto extraído: Influenciador: Oren & Co Compañía: Brand Capital --







Contrato: Este Acuerdo de grabación musical ("Acuerdo") entra en vigencia a partir del día 13 de diciembre de 2021 entre Good Kid, un grupo musical con sede en Toronto ("Artista") y Universal Music Group, un sello discográfico con licencia número 545345 ("Etiqueta discográfica"). El artista y el sello discográfico pueden ser referidos en este Acuerdo individualmente como una "Parte" y colectivamente como las "Partes". El trabajo bajo este Acuerdo comenzará el 15 de marzo de 2022.


Texto extraído:

Terminación:

Artista: Good Kid Sello discográfico: Universal Music Group

Puede probarlo accediendo al preset guardado .

Algunos otros casos de uso en esta categoría incluyen:

  • Extraer entidades nombradas de un documento
  • Extraiga palabras clave y frases clave de artículos
  • Marcar para información de identificación personal
  • Extraer proveedor y términos del contrato
  • Crear etiquetas para blogs

Conclusión

En la segunda parte de esta serie , continuaremos nuestra exploración de las tres categorías de casos de uso restantes (Búsqueda/similitud, agrupación y clasificación). También exploraremos cómo las API LLM pueden ayudar a abordar casos de uso más complejos. El mundo es complejo y muchos problemas solo se pueden abordar juntando varios modelos de PNL. Veremos algunos ejemplos de cómo podemos unir rápidamente una combinación de puntos finales de API para crear soluciones más completas.

0 comentarios: