La amarga lección: por qué ChatGPT Triunfó sobre las técnicas computacionales artesanales
En Resumen
El ensayo de 2019 del profesor Rich Sutton, "La lección amarga", predice avances significativos en IA, como ChatGPT/GPT-4 y OpenAImetodologías de .
El texto destaca el cambio de paradigma en la IA, donde los métodos computacionales dominan el rendimiento sin la intuición humana.
Cuantos sean los investigadores siguen buscando enfoques basados en la intuición, pasando por alto el potencial de los métodos basados en el cálculo.
El ensayo "La lección amarga”, escrito por el profesor Rich Sutton en 2019, desde entonces ha ganado importancia para los expertos en aprendizaje automático y las personas interesadas en comprender el futuro de la IA. Las ideas proporcionadas en este documento previeron desarrollos importantes en IA, incluida la aparición de ChatGPT/GPT-4 y la aceptación de OpenAImetodologías de.
El núcleo de "La lección amarga" explora un cambio de paradigma en el campo de la IA. En el pasado, los científicos que estudiaban la IA tenían la tendencia a pensar que desarrollar una IA avanzada requería un enfoque notable y distintivo, también conocido como "sesgo inductivo". Esta idea alude a la adición de información especializada o comprensión intuitiva de un problema específico, que luego dirige el camino de solución de la máquina.
El tema central de “La lección amarga” examina un cambio de paradigma en el estudio de la inteligencia artificial. Anteriormente, los investigadores que estudiaban la IA tenían una propensión a creer que crear una IA avanzada requería un enfoque extraordinario y único. Este sesgo se denomina "sesgo inductivo". Este concepto sugiere la adición de conocimiento especializado o visión intuitiva de un problema en particular, que luego dirige el camino de solución de la máquina.
Pero se hizo evidente un patrón recurrente. Los investigadores encontraron repetidamente que simplemente agregando más datos y poder computacional, podrían superar los resultados producidos por estos métodos meticulosamente elaborados. Este patrón no era específico de un campo, pero apareció en ajedrez, go, starcraft y probablemente nethack también. Redes neuronales convolucionales, por ejemplo, funcionan mejor en el campo de la visión artificial que las técnicas manuales como SIFT. Es interesante notar que el inventor de SIFT dijo más tarde que si las redes neuronales hubieran existido cuando estaba realizando su investigación, habría elegido ese curso de acción. Similar a ésto, Los LSTM superaron a todos los sistemas basados en reglas en el campo de la traducción automática. Usando una estrategia simple de "agregar más capas", ChatGPT/GPT-4, un ejemplo destacado de esta tendencia, pudo superar los modelos altamente desarrollados creados por lingüistas computacionales.
El núcleo de la "lección amarga" de Sutton es que los métodos computacionales que no son modificados por la intuición humana frecuentemente superan a otros enfoques en términos de desempeño. Este entendimiento, sin embargo, no ha sido ampliamente aceptado. Muchos investigadores aún persiguen estrategias complejas basadas en la intuición, ignorando con frecuencia el potencial de los enfoques inclusivos basados en el cálculo.
Cinco razones por las que GPT triunfó sobre las técnicas computacionales artesanales:
- Escalabilidad: Los métodos computacionales, especialmente cuando se complementan con más datos, tienen el potencial de evolucionar y adaptarse a medida que avanza la tecnología, haciéndolos más preparados para el futuro.
- Eficiencia: Los métodos generales basados en cálculos y datos han superado sistemáticamente a los métodos especializados basados en la intuición humana en varios dominios, desde juegos como el ajedrez y Go hasta la traducción automática y la visión artificial.
- Amplia aplicabilidad: estos métodos generales basados en computación son versátiles y se pueden aplicar en varias disciplinas sin necesidad de ajustes específicos del dominio.
- Sencillez: Sistemas construidos en bruto potencia de cálculo y los datos tienden a ser más simples en su enfoque, sin la necesidad de ajustes complejos basados en la intuición humana.
- Rendimiento consistente: Como lo demuestran ejemplos como ChatGPT/GPT-4, los modelos basados en cálculos pueden lograr un alto rendimiento constante, superando a menudo los métodos especializados.
El ensayo original es una herramienta invaluable para comprender mejor el punto de vista del profesor Sutton y los principios que guían esta trayectoria de IA.
El artículo fue inspirado por el canal de Telegram”Borís otra vez."
Lea más sobre la IA:
Aviso
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.