Introducción y explicación de los modelos

3. DISEÑO Y DESARROLLO DE LA SOLUCIÓN

3.3. Selección de los modelos de lenguaje natural

3.3.1. Introducción y explicación de los modelos

28 En cuanto a otras posibles opciones para la extracción de datos de las páginas web de los medios digitales, se exploraron diferentes enfoques. Inicialmente, se desarrolló un bot utilizando la biblioteca Selenium, que permitía inspeccionar cada página web y extraer el texto correspondiente. Sin embargo, surgieron problemas a la hora de implementar este enfoque en el robot, debido a su complejidad y a las limitaciones de recursos del sistema.

Además, se observaron tiempos de extracción más lentos en comparación con otras alternativas.

También se exploró el uso de feeds RSS (Really Simple Syndication) como fuente de noticias. Sin embargo, tras realizar pruebas comparativas, se observó que la extracción de datos a través de Beautiful Soup ofrecía velocidades significativamente mayores y una mayor flexibilidad en la manipulación del contenido.

Finalmente, se evaluó el uso de Beautiful Soup, una biblioteca de Python que ofrece una forma más sencilla y eficiente de extraer datos de archivos HTML y XML. Con Beautiful Soup, fue posible navegar, buscar y modificar la estructura de análisis sintáctico de los documentos web de manera más eficiente. Esto permitió obtener el contenido deseado de manera más rápida y con una mayor facilidad de implementación en el robot.

3.3. Selección de los modelos de lenguaje natural

29 Por otro lado, está OpenAI, una empresa de investigación y desarrollo de Inteligencia Artificial con sede en San Francisco. Fundada en 2015, OpenAI se ha convertido en una de las principales referencias en el campo de la Inteligencia Artificial y es reconocida por sus grandes avances en el procesamiento del lenguaje natural durante este último año.

Para hacer uso de los modelos, en el caso de Hugging Face pueden descargarse en local o llamar mediante su API y, en cuanto a OpenAI, debido a su gran tamaño siempre deben emplearse online. Respecto a la interacción con estos, se ha de utilizar un prompt que establece la comunicación e indica a los modelos cuáles son sus objetivos. En los modelos más sencillos, como son los de código abierto, el prompt se compone fundamentalmente de la información que ha de procesar ya que su tarea está intrínsecamente relacionada con el propio modelo. Sin embargo, para aquellos de carácter propietario es necesario realizar una mayor investigación sobre cómo interactuar con estos.

Por tanto, antes de comenzar, se ha de definir un concepto fundamental como es prompt, que puede entenderse como línea de comandos. Extensamente, un prompt, hace referencia a una instrucción, consulta o texto inicial proporcionada por un usuario para interactuar con un modelo de lenguaje, con el fin de obtener una respuesta específica o generar contenido relevante.

El prompt generalmente consiste en una oración o párrafo que establece el contexto y guía al modelo sobre lo que se espera de él. En esencia es el punto de partida para que el modelo comprenda la tarea o el problema en cuestión y proporcione una respuesta coherente y adecuada.

El éxito del modelo en la generación de contenido depende en gran medida de la calidad del prompt. Es importante tener en cuenta que los mayores grandes modelos de lenguaje son muy potentes, pero también pueden ser sensibles al formato y redacción del prompt.

Un prompt claro y bien formulado facilita la obtención de resultados precisos y coherentes. Los usuarios deben experimentar con diferentes enfoques del prompt y ajustarlos según sea necesario para obtener los resultados deseados en sus interacciones con el modelo. Además, es crucial ser consciente de que el modelo se basa en el texto proporcionado y no tiene comprensión o conocimiento real más allá de los datos con los que se entrenó, lo que implica que puede generar respuestas que parezcan precisas pero que no necesariamente sean correctas.

30 La metodología para crear y afinar un prompt efectivo varía según la tarea específica que se quiera abordar y el modelo de lenguaje que se esté utilizando. Sin embargo, se pueden seguir ciertas pautas generales para lograr resultados satisfactorios. Estas indicaciones se aconsejan expresamente por OpenAI y son las siguientes.

En primer lugar, es importante evitar ambigüedades y ofrecer una dirección clara al modelo. Utilizar un lenguaje directo y evitar redundancias innecesarias garantiza una mejor comprensión por parte del sistema. Además, si se busca obtener una respuesta específica, es recomendable formular el prompt en forma de pregunta o instrucción directa. De esta manera, se guía al modelo hacia el tipo de respuesta deseada y se evitan posibles interpretaciones erróneas. El uso de separadores también puede ser beneficioso en ciertas situaciones. Estos separadores, como comillas, barras verticales o corchetes, pueden ayudar a dividir el prompt en secciones y especificar partes clave del texto sobre las cuales el modelo debe enfocarse.

Otra técnica útil es el afinamiento de respuestas. En ocasiones, el modelo puede generar respuestas que no cumplen plenamente con las expectativas del usuario. En esos casos, se pueden emplear diferentes enfoques, como cambiar la formulación del prompt, agregar restricciones adicionales o especificar el formato específico de la respuesta deseada.

Para tener mayor control sobre la variabilidad de las respuestas generadas, se puede ajustar un parámetro denominado temperatura. Un valor de temperatura más alto producirá respuestas más creativas, pero menos coherentes, mientras que un valor de temperatura más bajo ofrecerá respuestas más predecibles y similares. Pequeñas modificaciones en el prompt pueden tener un impacto significativo en las respuestas generadas por el modelo.

El uso de ejemplos específicos en el prompt también puede mejorar la comprensión del modelo sobre lo que se busca o no se busca. Los modelos de lenguaje pueden aprender de los ejemplos proporcionados y utilizar esa información para generar respuestas más precisas y contextuales que sean similares.

Por último, siempre se recomienda verificar la información importante y no depender ciegamente de las respuestas del modelo sin confirmar su validez en fuentes confiables.

La revisión de los resultados y el análisis cuidadoso son prácticas indispensables para garantizar la precisión y la calidad del contenido generado por los modelos de lenguaje.

31 Seguidamente, en la Figura 4 se expone un diagrama de componentes del funcionamiento de la implementación de los diferentes modelos de lenguaje. Cada elemento se analizará particularmente más adelante en sus correspondientes apartados.

Figura 4: Implementación de los modelos de lenguaje natural

Cabe decir que el diagrama de implementación presentado es fruto de diversas pruebas y configuraciones con otros modelos, de todos ellos se destacarán exclusivamente los que se han seleccionado y el siguiente mejor a fin de poder establecer una comparación. Para el caso de OpenAI se presentará únicamente el prompt final resultado del proceso que se ha descrito con anterioridad. En la parte de procesamiento se englobará principalmente la función diseñada mediante expresiones regulares que permite eliminar caracteres que no puedan ser procesador por el robot a la hora de enunciarlos, espacios innecesarios y otros elementos que dificultan la claridad del texto y puedan perjudicar en el resultado final.

In document Uso de modelos de lenguaje natural para la interacción humano-robot (página 44-48)