Opinión Tecnología
27 de diciembre de 2023

Anand S, director ejecutivo de Gramener, advierte sobre los riesgos de confiar ciegamente en los LLM y aboga por la alfabetización modelo

En Resumen

En una conversación con Metaverse Post – Anand S, director ejecutivo de Gramener, destacó los posibles peligros de una dependencia excesiva de los LLM.

Anand S, director ejecutivo de Gramener, destaca los riesgos de confiar ciegamente en los LLM y aboga por la alfabetización modelo

Con cientos de herramientas de inteligencia artificial y aprendizaje automático saturando el mercado, el potencial de innovación es ilimitado. Están surgiendo numerosas empresas emergentes para abordar los desafíos de la industria, mientras que una afluencia constante de modelos de lenguaje grande mejorados cada semana amplifica el poder transformador de IA generativa. Esta convergencia tecnológica está remodelando industrias con posibilidades ilimitadas.

Sin embargo, la publicación y el uso generalizado de modelos de lenguaje poderosos como Gemini plantea importantes consideraciones éticas y prácticas y nos pide que consideremos una pregunta: ¿Podemos, como humanos, confiar ciegamente en tales modelos?

En una conversación con Metaverse Post — Anand S, director ejecutivo de una empresa B2B SaaS con sede en EE. UU. gramer enfatizó los peligros potenciales de una dependencia excesiva de los LLM como ChatGPT, advirtiendo que es probable que esta tendencia persista con modelos emergentes como Gemini.

“Incluso con los datos de entrenamiento correctos, un humano puede cometer errores al salir de su área de especialización. Por lo tanto, ¿un gran modelo lingüístico está extrapolando o está recordando lo que ha aprendido? Hay una gran diferencia y vale la pena probarla. Generamos confianza a través de intuiciones con interacciones repetidas con las personas”, dijo Anand. "Sabemos que necesitamos sondear para investigar a un extraño y así es como probablemente también deberíamos interactuar con modelos de lenguaje grandes".

Por ejemplo, en el caso limitado de la compañía Varghese versus Southern Airlines, un abogado citó ChatGPT-Casos generados, que llevan a que un juez sancione al abogado, enfatizando los riesgos de un uso acrítico. Anand destaca la necesidad de precaución y escrutinio al aprovechar dichos modelos lingüísticos.

Además de esto, el campo exige un mecanismo de retroalimentación sólido. ChatGPT fomenta la retroalimentación de los usuarios a través de un simple botón de pulgar hacia arriba o hacia abajo, junto con la entrada de texto. Este enfoque recopila información valiosa sobre lo que funciona bien y lo que no. Es probable que este sistema de retroalimentación se vuelva más común con el uso de grandes modelos de lenguaje, ayudando a mejorar su rendimiento.

"No es muy económico monitorear cada resultado de un LLM, pero poder detectar errores potenciales es una palanca poderosa", dijo Anand. Metaverse Post.

“Lo interesante es que los modelos de lenguaje grandes en sí mismos son bastante buenos para evaluar otros modelos de lenguaje grandes. Entonces, en lugar de utilizar un humano exclusivamente para monitorear el resultado, podemos usar una combinación de LLM y humanos, y los LLM eventualmente asumirán la mayor parte del rol humano a medida que evolucionan”, agregó.

La alfabetización modelo es el camino a seguir

En el ámbito de los LLM, surge un principio clave: cuanta más interacción, más profunda es la comprensión. Este concepto sencillo subraya la relación entre la participación del usuario y la comprensión de las capacidades de LLM, lo que en última instancia impulsa una mayor utilización.

“También se trata de comprender para qué sirve un LLM en particular. Por ejemplo, no usaría DALL-E para generar logotipos porque no genera texto muy bien. Pero hace un gran trabajo generando ideas y diseños de logotipos. Este es un ejemplo de alfabetización modelo que surge del uso repetido y, por lo tanto, me da defi"Necesitamos áreas de confianza dentro de las cuales puedo utilizar el modelo de manera más efectiva", dijo Anand.

En la búsqueda de una integración equilibrada de modelos lingüísticos como Gemini En nuestro panorama tecnológico, Anand sugiere varias estrategias. En primer lugar, aboga por las interacciones diarias con modelos de lenguaje de gran tamaño, fomentando un hábito que se desarrolla con el tiempo. Del mismo modo, garantizar el acceso universal a estas herramientas es crucial, lo que exige un mayor fomento de su uso personal. Anand señala la tendencia existente de las organizaciones a bloquear ChatGPT en computadoras portátiles de trabajo, lo que subraya la necesidad de una comunicación de apoyo.

Propone implementar mecanismos organizacionales para brindar acceso y fomentar la experimentación con modelos de lenguaje (LLM) dentro de un entorno.

“En última instancia, cuando las personas se familiarizan, entienden en qué confiar, cuándo usarlo y cómo usarlo. Un mayor uso y fomentar un mayor uso son la estrategia y las iniciativas educativas más importantes que cualquiera puede emplear”, dijo Anand. Metaverse Post.

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Kumar es un periodista tecnológico experimentado con especialización en las intersecciones dinámicas de AI/ML, tecnología de marketing y campos emergentes como cripto, blockchain y NFTs. Con más de 3 años de experiencia en la industria, Kumar ha establecido una trayectoria comprobada en la elaboración de narrativas convincentes, la realización de entrevistas interesantes y la entrega de conocimientos integrales. La experiencia de Kumar radica en la producción de contenido de alto impacto, incluidos artículos, informes y publicaciones de investigación para plataformas industriales destacadas. Con un conjunto de habilidades único que combina conocimiento técnico y narración, Kumar se destaca en comunicar conceptos tecnológicos complejos a audiencias diversas de una manera clara y atractiva.

Más artículos
Kumar Gandharv
Kumar Gandharv

Kumar es un periodista tecnológico experimentado con especialización en las intersecciones dinámicas de AI/ML, tecnología de marketing y campos emergentes como cripto, blockchain y NFTs. Con más de 3 años de experiencia en la industria, Kumar ha establecido una trayectoria comprobada en la elaboración de narrativas convincentes, la realización de entrevistas interesantes y la entrega de conocimientos integrales. La experiencia de Kumar radica en la producción de contenido de alto impacto, incluidos artículos, informes y publicaciones de investigación para plataformas industriales destacadas. Con un conjunto de habilidades único que combina conocimiento técnico y narración, Kumar se destaca en comunicar conceptos tecnológicos complejos a audiencias diversas de una manera clara y atractiva.

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
L3 Blockchain Degen Chain se asocia con la plataforma de infraestructura Conduit para abordar su problema de tiempo de inactividad
Informe de noticias Tecnología
L3 Blockchain Degen Chain se asocia con la plataforma de infraestructura Conduit para abordar su problema de tiempo de inactividad
13 de mayo de 2024
3,050 ETH lavados hoy desde la billetera multifirma Parity y 83,017 ETH permanecen bajo control de piratas informáticos, detecta alertas de Cyvers
Industrias Informe de noticias Tecnología
3,050 ETH lavados hoy desde la billetera multifirma Parity y 83,017 ETH permanecen bajo control de piratas informáticos, detecta alertas de Cyvers
13 de mayo de 2024
Soland, el algoritmo de minería impulsado por ZKP, anuncia su lanzamiento y preventa de mineros de 20 días
Informe de noticias Tecnología
Soland, el algoritmo de minería impulsado por ZKP, anuncia su lanzamiento y preventa de mineros de 20 días
13 de mayo de 2024
Canaan lanza el nuevo Avalon Bitcoin Miner A1566 con eficiencia de rendimiento líder
Canaan lanza el nuevo Avalon Bitcoin Miner A1566 con eficiencia de rendimiento líder
13 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.