AGI (Inteligencia General Artificial)
Un hipotético sistema de IA que puede realizar la mayoría de las tareas intelectuales a nivel humano en muchos dominios.
Terminología técnica esencial explicada con el más alto nivel de claridad. Diseñado para investigadores, estudiantes y educación centrada en las personas.
Mostrando 213 términos coincidentes.
Un hipotético sistema de IA que puede realizar la mayoría de las tareas intelectuales a nivel humano en muchos dominios.
Un sistema de software que puede observar, razonar y tomar acciones para lograr un objetivo, a menudo utilizando herramientas y memoria.
El trabajo de hacer que los sistemas de IA se comporten de acuerdo con las intenciones, los valores y las limitaciones de seguridad humanos.
Políticas, estándares y mecanismos de supervisión que guían cómo se desarrolla y utiliza la IA en la sociedad.
Un campo enfocado en reducir comportamientos dañinos, fallas y riesgos de uso indebido en los sistemas de IA.
Un conjunto definido de reglas o pasos que sigue una computadora para resolver un problema o completar una tarea.
Injusticia sistemática en los resultados del modelo causada por datos, suposiciones o elecciones de modelado sesgados.
Con qué claridad están documentadas y son comprensibles la lógica, las fuentes de datos y las limitaciones de un sistema de IA.
Etiquetas o metadatos agregados por humanos que se utilizan para entrenar o evaluar modelos de aprendizaje automático.
Una forma estructurada para que un sistema de software envíe solicitudes y reciba respuestas de otro sistema.
El amplio campo de la construcción de sistemas que realizan tareas que requieren reconocimiento de patrones, razonamiento, lenguaje o toma de decisiones.
Un componente del modelo que se centra dinámicamente en partes relevantes de una entrada al producir una salida.
Un sistema que puede tomar decisiones y actuar con control humano directo limitado o nulo en tiempo real.
El algoritmo de entrenamiento central que actualiza los pesos del modelo propagando los errores de predicción hacia atrás a través de la red.
Un modelo de referencia simple que se utiliza para comparar si enfoques más complejos realmente mejoran los resultados.
Una prueba o conjunto de datos estandarizado que se utiliza para medir y comparar el rendimiento del modelo.
Un patrón constante de error o injusticia en los datos o el comportamiento del modelo.
Conjuntos de datos muy grandes y complejos que requieren técnicas de procesamiento y almacenamiento escalables.
Un modelo cuyo razonamiento interno es difícil de interpretar directamente por los humanos.
Qué tan bien coinciden las puntuaciones de confianza de un modelo con las probabilidades de corrección reales.
Un estilo de razonamiento en el que un modelo de IA descompone un problema en pasos intermedios.
Una tarea en la que un modelo asigna una entrada a una o más categorías predefinidas.
Un modelo diseñado específicamente para tareas de clasificación.
Una arquitectura de modelo multimodal que aprende representaciones compartidas entre texto e imágenes.
Los recursos de procesamiento necesarios para entrenar y ejecutar modelos, a menudo medidos en FLOPS u horas de GPU.
La rama de la IA que extrae significado de imágenes y vídeos.
La cantidad máxima de tokens de entrada que un modelo de lenguaje puede procesar a la vez.
Enfoques de entrenamiento que permiten que un modelo siga aprendiendo de nuevos datos sin olvidar el conocimiento previo.
Una arquitectura neuronal optimizada para procesar datos en forma de cuadrícula, como imágenes.
Una función objetivo común utilizada para entrenar modelos de clasificación penalizando las probabilidades incorrectas.
Técnicas que crean ejemplos de entrenamiento modificados para mejorar la generalización del modelo.
Un cambio en los datos de entrada del mundo real a lo largo del tiempo que puede degradar el rendimiento del modelo.
El proceso de asignar etiquetas o resultados de destino a datos sin procesar para el aprendizaje supervisado.
Una colección de ejemplos estructurados o no estructurados utilizados para capacitación, validación o prueba.
La superficie en el espacio de características que separa las clases predichas por un clasificador.
Un modelo que hace predicciones a través de una secuencia de divisiones de características si-entonces.
Un subconjunto del aprendizaje automático que utiliza redes neuronales de muchas capas para el aprendizaje de representación.
Una arquitectura generativa que aprende a revertir el ruido para sintetizar imágenes, audio u otro contenido.
Comprimir el conocimiento de un modelo de profesor grande a un modelo de estudiante más pequeño.
Métodos que transfieren un modelo entrenado en un dominio para que funcione mejor en otro dominio.
Una representación vectorial numérica que captura el significado semántico de texto, imágenes u otros datos.
El componente de un modelo que transforma la entrada en representaciones latentes.
Combinar predicciones de múltiples modelos para mejorar la solidez o la precisión.
Un conjunto de datos reservado que se utiliza para medir la calidad del modelo después del entrenamiento.
El grado en que el comportamiento de un modelo puede interpretarse y explicarse a los humanos.
Una predicción incorrecta en la que un modelo omite un caso positivo verdadero.
Una predicción incorrecta en la que un modelo marca incorrectamente un caso negativo como positivo.
Una variable de entrada utilizada por un modelo para hacer predicciones.
Diseñar o transformar variables de entrada para hacer el aprendizaje más fácil y efectivo.
Convertir datos sin procesar en características informativas que un modelo pueda utilizar.
Aprender o adaptar el comportamiento a partir de sólo un pequeño número de ejemplos.
Capacitación continua sobre datos de dominios específicos para adaptar un modelo previamente entrenado a una tarea específica.
Un gran modelo previamente entrenado que se puede adaptar a muchas tareas posteriores.
Una capacidad de modelo para generar llamadas estructuradas que activan herramientas externas o API.
Una configuración generativa donde un generador y un discriminador se entrenan entre sí.
Qué tan bien se desempeña un modelo con datos nuevos e invisibles fuera del conjunto de entrenamiento.
Sistemas de inteligencia artificial que producen contenido nuevo, como texto, imágenes, audio, video o código.
Un vector que muestra cuánto debe cambiar cada parámetro para reducir la pérdida.
Un método de optimización que actualiza los parámetros en la dirección que reduce el error.
Etiquetas de referencia confiables utilizadas para entrenar o evaluar los resultados del modelo.
Reglas, comprobaciones y controles que limitan el comportamiento inseguro o no deseado del modelo.
Cuando un modelo genera información fluida pero falsa o sin fundamento.
Un flujo de trabajo en el que los humanos revisan, guían o anulan los resultados de la IA.
Un valor de configuración establecido antes del entrenamiento, como la tasa de aprendizaje, el tamaño del lote o la profundidad.
La capacidad de un modelo para seguir patrones a partir de ejemplos proporcionados directamente en el mensaje.
La fase de tiempo de ejecución donde un modelo entrenado genera predicciones o resultados.
La cantidad de potencia de procesamiento consumida al producir cada respuesta.
Ajustar un modelo sobre pares instrucción-respuesta para mejorar el seguimiento de tareas.
Predecir el propósito del usuario a partir de una consulta de texto para encaminarlo correctamente.
Una técnica rápida destinada a eludir las limitaciones de seguridad de un modelo.
El último momento reflejado en los datos de entrenamiento de un modelo.
Entrenar un modelo más pequeño para imitar los resultados de un modelo más grande.
Una estructura gráfica de entidades y relaciones utilizadas para razonamiento o recuperación.
Un método de regularización que suaviza las etiquetas duras para mejorar la generalización.
El tiempo entre el envío de una solicitud y la recepción del resultado del modelo.
Un modelo de lenguaje entrenado en corpus de texto masivos para generar y analizar texto.
Un hiperparámetro de entrenamiento que controla cuánto cambian los parámetros en cada paso de actualización.
Un método de ajuste fino eficiente en parámetros que agrega matrices de adaptadores de bajo rango.
Un objetivo matemático que cuantifica el error de predicción durante el entrenamiento.
Métodos que permiten a los sistemas aprender patrones a partir de datos y mejorar con el tiempo.
Contexto almacenado que un agente de IA utiliza en todos los pasos o sesiones para mejorar la continuidad.
Una arquitectura con subredes especializadas donde solo se ejecutan expertos seleccionados por entrada.
Documentación que describe el uso previsto, las métricas, las limitaciones y los riesgos de un modelo.
Degradación del rendimiento con el tiempo a medida que las condiciones del mundo real difieren de los supuestos de entrenamiento.
Reducir la precisión numérica de los pesos del modelo para disminuir el costo de memoria e inferencia.
Un modelo que puede procesar o generar múltiples tipos de datos, como texto, imagen y audio.
Una tarea de PNL que identifica entidades como personas, lugares, fechas u organizaciones.
La rama de la IA se centró en comprender y generar el lenguaje humano.
Un modelo computacional en capas inspirado en neuronas y sinapsis biológicas.
Transformar valores a una escala consistente para mejorar la estabilidad de la optimización.
Tecnología que convierte texto en imágenes o escaneados en texto legible por máquina.
Un modelo lanzado con pesos o código públicos para inspección, adaptación y reutilización.
Cuando un modelo memoriza datos de entrenamiento y tiene un rendimiento deficiente en entradas invisibles.
Un peso aprendido dentro de un modelo que influye en sus resultados.
Métodos que adaptan modelos entrenando un pequeño subconjunto de parámetros agregados.
Una métrica del modelo de lenguaje que mide cuán sorprendido está el modelo por los próximos tokens verdaderos.
Un flujo de trabajo ordenado de preprocesamiento, pasos del modelo y etapas de posprocesamiento.
La proporción de positivos previstos que realmente son correctos.
Entrenamiento inicial de modelos a gran escala sobre datos amplios antes de la adaptación posterior.
Las instrucciones de entrada y el contexto proporcionados a un modelo generativo.
Diseño de indicaciones para mejorar la calidad, confiabilidad y controlabilidad de la salida.
Un patrón de ataque en el que se insertan instrucciones maliciosas en las entradas del modelo o en el contenido recuperado.
Eliminación de pesos o neuronas del modelo menos importantes para reducir el tamaño y el cálculo.
Conversión de pesos de modelos a formatos de menor precisión, como 8 bits o 4 bits.
Un método que recupera conocimiento externo y lo alimenta a la generación en el momento de la inferencia.
La proporción de positivos reales que un modelo identifica correctamente.
Un canal modelo que predice las preferencias de los usuarios para clasificar contenidos o productos.
Poner a prueba un sistema de IA con indicaciones adversas para revelar fallas y riesgos.
Entrenamiento mediante señales de recompensa donde un agente aprende acciones que maximizan el retorno a largo plazo.
Un método de entrenamiento que utiliza señales de preferencia humana para dar forma al comportamiento del modelo.
Encontrar documentos o registros relevantes de una fuente de conocimiento para una consulta.
Un modelo que califica las salidas en función de señales de preferencia, que se utiliza a menudo en las canalizaciones RLHF.
La capacidad de un modelo para mantener el rendimiento bajo ruido, cambios o entradas adversas.
Una capa de moderación que bloquea o reescribe entradas o salidas inseguras del modelo.
Una relación empírica que muestra cómo mejora el rendimiento con el tamaño, los datos o la computación del modelo.
Búsqueda que coincida con el significado en lugar de la superposición exacta de palabras clave, a menudo mediante incrustaciones.
Aprender representaciones a partir de datos sin etiquetar prediciendo partes enmascaradas o transformadas.
Una tarea de PNL que clasifica el tono emocional o la opinión en un texto.
Un modelo de lenguaje compacto optimizado para reducir la latencia, el costo o el uso en el dispositivo.
Un modelo donde muchos parámetros son cero o están inactivos para reducir el cálculo.
Entrenar un modelo con ejemplos etiquetados que asignan entradas a salidas conocidas.
Datos generados artificialmente que se utilizan para aumentar, simular o proteger datos confidenciales de entrenamiento.
Una instrucción de alta prioridad que establece el comportamiento, la política y el estilo de respuesta de un modelo.
Una configuración de muestreo que controla la aleatoriedad en los resultados generados.
Un fragmento de texto procesado por modelos de lenguaje, como una palabra o un símbolo.
El proceso de dividir el texto en tokens para la entrada del modelo.
La capacidad de un modelo para llamar a herramientas externas como búsqueda, calculadoras o API.
Una estrategia de decodificación que toma muestras solo de los k tokens siguientes más probables.
Una estrategia de decodificación que toma muestras del conjunto de tokens más pequeño cuyas probabilidades suman p.
Aplicar el conocimiento aprendido en una tarea o dominio para mejorar otra tarea.
Una arquitectura neuronal que utiliza la atención para modelar relaciones entre secuencias en paralelo.
El valor de error del modelo calculado durante el entrenamiento y optimizado hacia abajo con el tiempo.
Patrones de aprendizaje a partir de datos sin etiquetar sin resultados objetivo explícitos.
Un conjunto de datos utilizado durante el desarrollo para ajustar modelos y evitar el sobreajuste.
Una base de datos optimizada para almacenar y consultar vectores de incrustación de alta dimensión.
Un modelo multimodal que procesa conjuntamente información visual y textual.
Usar etiquetas ruidosas, heurísticas o parciales para entrenar modelos cuando las etiquetas limpias son escasas.
Un valor numérico aprendido que escala las señales que pasan a través de una red neuronal.
Una representación vectorial densa de palabras que capturan relaciones semánticas.
Técnicas y prácticas para hacer que las predicciones de la IA sean más transparentes y comprensibles.
Resolver tareas sin ejemplos específicos de tareas basándose en conocimientos generales previos.
Un proceso de varios pasos en el que un sistema de IA planifica, ejecuta, verifica los resultados e itera hacia un objetivo.
El marco regulatorio basado en riesgos de la Unión Europea para sistemas y proveedores de IA.
El costo adicional en tiempo, computación o velocidad del producto requerido para hacer que los sistemas sean más seguros y controlables.
Cuando hay ejemplos de pruebas comparativas o variantes cercanas en los datos de entrenamiento, se infla el rendimiento informado.
Métodos para estimar relaciones de causa y efecto en lugar de simples correlaciones.
Un rango estadístico que probablemente contiene el valor real de una métrica del modelo medido.
Un enfoque de capacitación y configuración del comportamiento en el que los resultados del modelo se guían por un conjunto fijo de principios escritos.
Un registro de dónde provienen los datos, cómo se transformaron y dónde se utilizan.
El origen, la propiedad y el historial documentados de un conjunto de datos o artefacto modelo.
Una técnica de privacidad que agrega ruido estadístico para que los registros individuales no puedan inferirse de manera confiable a partir de los resultados.
Un modelo más pequeño entrenado para imitar el comportamiento de un modelo más grande mientras usa menos computación en la inferencia.
Un modelo especializado para convertir datos en vectores utilizados para búsqueda, agrupación y recuperación semántica.
Un marco de evaluación repetible que ejecuta indicaciones, conjuntos de datos y lógica de puntuación en todas las versiones del modelo.
Un sistema administrado para almacenar y ofrecer funciones de aprendizaje automático validadas de manera consistente para capacitación e inferencia.
El grado en que una respuesta de IA está respaldada por datos de origen o evidencia recuperada.
Una estrategia de generación que limita los tokens de salida a estructuras válidas o elecciones que cumplan con las políticas.
Un modelo entrenado en clasificaciones humanas para predecir qué respuestas probablemente preferirán los usuarios.
Una interfaz API implementada que recibe solicitudes de modelo y devuelve predicciones en producción.
Una colección seleccionada de documentos o registros utilizados para la recuperación, la automatización de soporte o las respuestas de conexión a tierra.
Un espacio de representación comprimido donde conceptos similares se colocan uno cerca del otro como vectores.
Un catálogo central para versiones, aprobación y seguimiento de modelos en todos los entornos.
La inferencia de IA se realiza localmente en el hardware del usuario en lugar de en un servicio remoto en la nube.
Lógica que valida y convierte la salida del modelo en estructuras fuertemente tipadas y utilizables por máquinas.
Un patrón de indicaciones reutilizable con variables, reglas de formato e instrucciones específicas de tareas.
La proporción de elementos recuperados que son relevantes para la consulta del usuario.
Un argumento estructurado, respaldado por evidencia, de que un sistema de IA es seguro para un contexto de uso definido.
Ejecutar un modelo en paralelo con el tráfico de producción sin afectar las decisiones de cara al usuario.
Salida del modelo restringida a un esquema definido como JSON, argumentos de herramienta o campos escritos.
Cálculo de inferencia adicional utilizado durante la generación de respuestas para mejorar la calidad o el razonamiento.
Alinear la confianza del usuario en los resultados de la IA con la confiabilidad real del sistema en cada tarea.
Precios donde los costos escalan con llamadas API, tokens, tiempo de inferencia o computación consumida.
Una política en la que las cargas útiles de solicitud/respuesta no se almacenan después del procesamiento más allá de ventanas operativas de corta duración.
Un método de aceleración de inferencia en el que un modelo borrador pequeño propone tokens que un modelo más grande verifica en paralelo.
Tensores de clave y valor almacenados de tokens anteriores que permiten a los transformadores generar nuevos tokens sin volver a calcular la atención pasada.
Un protocolo abierto que permite que las aplicaciones de IA se conecten a herramientas externas, fuentes de datos y proveedores de contexto de forma estándar.
Un ciclo iterativo en el que un agente de IA observa, planifica, actúa y reflexiona hasta completar un objetivo o alcanzar una condición de parada.
Un patrón de indicaciones que entrelaza pasos de razonamiento con acciones de uso de herramientas para resolver tareas de manera más confiable.
Un enfoque de razonamiento en el que un modelo explora múltiples caminos de solución ramificados y selecciona los más prometedores.
Un método de entrenamiento que afina los modelos directamente en pares de preferencias sin necesidad de un modelo de recompensa separado.
Una técnica de ajuste que combina la cuantificación de peso de 4 bits con adaptadores LoRA para reducir las necesidades de memoria.
Un algoritmo de atención optimizado que reduce el uso de memoria y acelera el entrenamiento y la inferencia de transformadores.
Un mecanismo transformador que ejecuta varias operaciones de atención en paralelo para capturar diferentes tipos de relaciones.
Información agregada a las incrustaciones de tokens para que los transformadores puedan distinguir el orden de secuencia.
Un método de codificación posicional que rota los vectores clave y de consulta para codificar posiciones relativas de tokens.
Un método de sesgo posicional que penaliza las puntuaciones de atención en función de la distancia simbólica, lo que ayuda a los modelos a extrapolar a contextos más largos.
Un patrón de atención en el que cada token atiende solo a una ventana de tamaño fijo de tokens cercanos para reducir la computación.
Un algoritmo de tokenización de subpalabras que fusiona los pares de caracteres más frecuentes en tokens reutilizables.
Un tokenizador independiente del idioma que aprende unidades de subpalabras directamente a partir de texto sin formato sin dividirlo previamente en espacios en blanco.
Algoritmos que encuentran vectores cercanos a una consulta sin una comparación exhaustiva, intercambiando exactitud por velocidad.
Una estructura de índice basada en gráficos para una búsqueda rápida y aproximada del vecino más cercano en vectores de alta dimensión.
Un modelo que reordena un conjunto inicial de resultados recuperados para colocar los elementos más relevantes en la parte superior.
Un enfoque de recuperación que combina la búsqueda de palabras clave (léxicas) con la búsqueda de vectores (semántica) para una mejor recuperación y precisión.
Un modelo que califica una consulta y un documento juntos en una sola pasada para realizar juicios de relevancia de alta precisión.
Un modelo que codifica consultas y documentos en vectores separados para que puedan compararse rápidamente a escala.
Usar un modelo de lenguaje para calificar o comparar resultados de otros modelos durante la evaluación.
Una métrica de evaluación de código que mide la probabilidad de que al menos una de las k muestras generadas pase las pruebas.
Un punto de referencia que prueba modelos de lenguaje en 57 materias académicas y profesionales mediante preguntas de opción múltiple.
Un punto de referencia de los problemas de programación de Python utilizado para medir la corrección de la generación de código mediante pruebas unitarias.
Un punto de referencia de los problemas escritos de matemáticas de la escuela primaria que se utiliza para evaluar el razonamiento paso a paso en modelos de lenguaje.
Con qué precisión las afirmaciones de un modelo coinciden con información verificable del mundo real.
Referencias a pasajes fuente o documentos incluidos en la respuesta de un modelo para respaldar sus afirmaciones.
Incrustar una señal detectable en texto o medios generados por IA para que luego pueda identificarse como producida por una máquina.
Una fase de entrenamiento intermedia entre el preentrenamiento y el post-entrenamiento, a menudo utilizada para ajustes de capacidad o dominio.
Pasos de capacitación aplicados después del entrenamiento previo, como ajuste de instrucciones, optimización de preferencias y ajuste de seguridad.
Una configuración de entrenamiento donde un modelo mejora generando datos a través de interacciones o competencias con copias de sí mismo.
Un método de recuperación que genera múltiples variantes de consulta, recupera resultados para cada una y fusiona las clasificaciones.
Una técnica de recuperación que reescribe la consulta del usuario en varias variantes para mejorar la recuperación.
Un patrón de recuperación que busca fragmentos pequeños pero devuelve sus documentos principales más grandes para un contexto más rico.
Un algoritmo de decodificación que mantiene las principales secuencias candidatas en cada paso para encontrar resultados de mayor probabilidad.
Una configuración de decodificación que reduce la probabilidad de tokens que el modelo ya ha producido para reducir los bucles.
Una configuración de decodificación que reduce la probabilidad de los tokens proporcionalmente a la frecuencia con la que han aparecido hasta ahora.
Una configuración de decodificación que reduce la probabilidad de que aparezcan tokens, fomentando nuevos temas.