Marco de investigación

AIR

Investigación Inteligente Autónoma para búsqueda agéntica de arquitecturas neuronales.

Activo

AIR es el marco de Rkive para búsqueda agéntica de arquitecturas neuronales (NAS). Tres agentes — investigador, supervisor, analista — operan con memoria persistente, asignación inteligente de presupuesto y registros estructurados de experimentos. Cada ciclo hereda el aprendizaje previo a través de MAIC-RL, un protocolo de aprendizaje por refuerzo en contexto aumentado por memoria. AIR extiende la autoinvestigación hacia búsqueda multi-agente estructurada con legibilidad taxonómica.

Investigación razonada, no prueba y error

AIR trabaja a través de experimentos, ciclos de dirección y barridos más amplios, acumulando aprendizaje de los fracasos en lugar de ejecutar prueba y error a ciegas. El supervisor reasigna esfuerzo conforme llegan resultados. El analista sintetiza patrones entre ejecuciones. Las funciones de activación y formulaciones de pérdida personalizadas se inventan en tiempo de ejecución y se validan por AST antes de inyectar.

OpenAI Parameter Golf

AIR impulsa un envío de récord abierto a 1.1396 val_bpb en la competencia OpenAI Parameter Golf, por delante del leaderboard combinado en 1.1428 (marzo 2026). A través de más de 70 experimentos y cinco ciclos de barrido, el marco produjo técnicas novedosas incluyendo cuantización adaptativa guiada por gradiente e invención de funciones en tiempo de ejecución, junto con trazas de búsqueda reutilizables para entrenamiento de meta modelos.

Dirección inteligente

Experimento, ciclo y barrido

El presupuesto se reasigna entre experimentos, ciclos y barridos conforme llegan los resultados — no se tratan como ejecuciones aisladas. El supervisor poda enfoques obsoletos y concentra el esfuerzo donde la señal es más fuerte.

Variación multinivel

Arquitectura, técnica e hiperparámetros

Las opciones de arquitectura, función de activación, receta de entrenamiento e hiperparámetros se exploran conjuntamente. En optimización con restricciones, las ganancias suelen venir de interacciones entre variables, no de ajustar un solo parámetro.

Compensación de sesgo

Asignación de presupuesto y escritura de funciones en tiempo de ejecución

El presupuesto se ajusta bajo señales de recompensa ruidosas. El supervisor puede definir nuevas funciones de activación y formulaciones de pérdida en tiempo de ejecución, remodelando el espacio de búsqueda conforme emergen patrones prometedores.

AIR emite registros de experimentos estructurados, decisiones de dirección y salidas analíticas que se acumulan entre familias de modelos en lugar de descartarse después de cada ejecución.

La búsqueda se vuelve acumulativa: el marco retiene qué funcionó, qué falló y por qué.

AIR

Investigación razonada, no prueba y error

OpenAI Parameter Golf

Dirección inteligente

Variación multinivel

Compensación de sesgo

Join Our Newsletter

Join Our Newsletter

Studio

Comms

HQ

Base

Research

Company

Pricing

Connect

Privacidad