- 1,186
- 5,489
La ARC (Alignment Research Center) es una organización sin fines de lucro dedicada a la investigación de la alineación de la inteligencia artificial con los valores humanos. Recientemente, la ARC publicó un informe sobre sus evaluaciones de GPT-4, el último modelo de lenguaje multimodal de OpenAI, que puede procesar tanto imágenes como texto. Según el informe, la ARC sometió a GPT-4 a una serie de pruebas para medir su capacidad de razonamiento, creatividad, seguridad y alineación. Algunas de las pruebas incluyeron:
El informe concluye que GPT-4 es el sistema más avanzado de OpenAI hasta la fecha, produciendo respuestas más seguras y útiles. Sin embargo, también advierte que GPT-4 todavía tiene limitaciones y riesgos, y que se necesita más investigación para garantizar su alineación con los objetivos humanos.
- Simular exámenes profesionales y académicos, como el examen de abogacía o la olimpiada de biología. GPT-4 superó a GPT-3.5 en todos los exámenes, obteniendo puntuaciones alrededor del 10% superior de los examinados en el examen de abogacía y alrededor del 99% en la olimpiada de biología (con visión).
- Generar y editar contenido creativo y técnico, como componer canciones, escribir guiones o aprender el estilo de escritura del usuario. GPT-4 demostró ser más creativo y colaborativo que GPT-3.5, capaz de generar, editar e iterar con los usuarios en tareas de escritura.
- Responder a instrucciones complejas y matizadas, como explicar el argumento de Cenicienta en una frase donde cada palabra tiene que empezar por la siguiente letra del alfabeto de la A a la Z, sin repetir ninguna letra. GPT-4 fue más fiable y capaz de manejar instrucciones mucho más matizadas que GPT-3.5.
El informe concluye que GPT-4 es el sistema más avanzado de OpenAI hasta la fecha, produciendo respuestas más seguras y útiles. Sin embargo, también advierte que GPT-4 todavía tiene limitaciones y riesgos, y que se necesita más investigación para garantizar su alineación con los objetivos humanos.