ECONOMÉTRICOS Tecnología
27 de Julio de 2023

La amarga lección: por qué ChatGPT Triunfó sobre las técnicas computacionales artesanales

En Resumen

El ensayo de 2019 del profesor Rich Sutton, "La lección amarga", predice avances significativos en IA, como ChatGPT/GPT-4 y OpenAImetodologías de .

El texto destaca el cambio de paradigma en la IA, donde los métodos computacionales dominan el rendimiento sin la intuición humana.

Cuantos sean los investigadores siguen buscando enfoques basados ​​en la intuición, pasando por alto el potencial de los métodos basados ​​en el cálculo.

El ensayo "La lección amarga”, escrito por el profesor Rich Sutton en 2019, desde entonces ha ganado importancia para los expertos en aprendizaje automático y las personas interesadas en comprender el futuro de la IA. Las ideas proporcionadas en este documento previeron desarrollos importantes en IA, incluida la aparición de ChatGPT/GPT-4 y la aceptación de OpenAImetodologías de.

La amarga lección: por qué ChatGPT Triunfó sobre las técnicas computacionales artesanales
Créditos: Metaverse Post / Profesor Rich Sutton

El núcleo de "La lección amarga" explora un cambio de paradigma en el campo de la IA. En el pasado, los científicos que estudiaban la IA tenían la tendencia a pensar que desarrollar una IA avanzada requería un enfoque notable y distintivo, también conocido como "sesgo inductivo". Esta idea alude a la adición de información especializada o comprensión intuitiva de un problema específico, que luego dirige el camino de solución de la máquina.

El tema central de “La lección amarga” examina un cambio de paradigma en el estudio de la inteligencia artificial. Anteriormente, los investigadores que estudiaban la IA tenían una propensión a creer que crear una IA avanzada requería un enfoque extraordinario y único. Este sesgo se denomina "sesgo inductivo". Este concepto sugiere la adición de conocimiento especializado o visión intuitiva de un problema en particular, que luego dirige el camino de solución de la máquina.

Pero se hizo evidente un patrón recurrente. Los investigadores encontraron repetidamente que simplemente agregando más datos y poder computacional, podrían superar los resultados producidos por estos métodos meticulosamente elaborados. Este patrón no era específico de un campo, pero apareció en ajedrez, go, starcraft y probablemente nethack también. Redes neuronales convolucionales, por ejemplo, funcionan mejor en el campo de la visión artificial que las técnicas manuales como SIFT. Es interesante notar que el inventor de SIFT dijo más tarde que si las redes neuronales hubieran existido cuando estaba realizando su investigación, habría elegido ese curso de acción. Similar a ésto, Los LSTM superaron a todos los sistemas basados ​​en reglas en el campo de la traducción automática. Usando una estrategia simple de "agregar más capas", ChatGPT/GPT-4, un ejemplo destacado de esta tendencia, pudo superar los modelos altamente desarrollados creados por lingüistas computacionales.

El núcleo de la "lección amarga" de Sutton es que los métodos computacionales que no son modificados por la intuición humana frecuentemente superan a otros enfoques en términos de desempeño. Este entendimiento, sin embargo, no ha sido ampliamente aceptado. Muchos investigadores aún persiguen estrategias complejas basadas en la intuición, ignorando con frecuencia el potencial de los enfoques inclusivos basados ​​en el cálculo.

Cinco razones por las que GPT triunfó sobre las técnicas computacionales artesanales:

  1. Escalabilidad: Los métodos computacionales, especialmente cuando se complementan con más datos, tienen el potencial de evolucionar y adaptarse a medida que avanza la tecnología, haciéndolos más preparados para el futuro.
  2. Eficiencia: Los métodos generales basados ​​en cálculos y datos han superado sistemáticamente a los métodos especializados basados ​​en la intuición humana en varios dominios, desde juegos como el ajedrez y Go hasta la traducción automática y la visión artificial.
  3. Amplia aplicabilidad: estos métodos generales basados ​​en computación son versátiles y se pueden aplicar en varias disciplinas sin necesidad de ajustes específicos del dominio.
  4. Sencillez: Sistemas construidos en bruto potencia de cálculo y los datos tienden a ser más simples en su enfoque, sin la necesidad de ajustes complejos basados ​​en la intuición humana.
  5. Rendimiento consistente: Como lo demuestran ejemplos como ChatGPT/GPT-4, los modelos basados ​​en cálculos pueden lograr un alto rendimiento constante, superando a menudo los métodos especializados.

El ensayo original es una herramienta invaluable para comprender mejor el punto de vista del profesor Sutton y los principios que guían esta trayectoria de IA.

El artículo fue inspirado por el canal de Telegram”Borís otra vez."

Lea más sobre la IA:

Aviso

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

De Ripple a The Big Green DAO: cómo los proyectos de criptomonedas contribuyen a la caridad

Exploremos iniciativas que aprovechen el potencial de las monedas digitales para causas benéficas.

Para saber más

AlphaFold 3, Med-Gemini y otros: la forma en que la IA transformará la atención médica en 2024

La IA se manifiesta de varias maneras en la atención médica, desde descubrir nuevas correlaciones genéticas hasta potenciar sistemas quirúrgicos robóticos...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
AI Wiki Digest Educación Estilo de vida Software Tecnología
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
14 de mayo de 2024
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
Estilo de vida Seguridad Wiki Software Historias y comentarios Tecnología
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
14 de mayo de 2024
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
Empresa Informe de noticias Tecnología
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
14 de mayo de 2024
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
Informe de noticias Tecnología
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
14 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.