AGI (Inteligência Geral Artificial)
Um hipotético sistema de IA que pode realizar a maioria das tarefas intelectuais em nível humano em muitos domínios.
Terminologia técnica essencial explicada com o mais alto nível de clareza. Projetado para pesquisadores, estudantes e educação centrada no ser humano.
Mostrando 213 termos correspondentes.
Um hipotético sistema de IA que pode realizar a maioria das tarefas intelectuais em nível humano em muitos domínios.
Um sistema de software que pode observar, raciocinar e realizar ações para atingir um objetivo, geralmente usando ferramentas e memória.
O trabalho de fazer com que os sistemas de IA se comportem de acordo com as intenções, valores e restrições de segurança humanas.
Políticas, padrões e mecanismos de supervisão que orientam a forma como a IA é desenvolvida e utilizada na sociedade.
Um campo focado na redução de comportamentos prejudiciais, falhas e riscos de uso indevido em sistemas de IA.
Um conjunto definido de regras ou etapas que um computador segue para resolver um problema ou concluir uma tarefa.
Injustiça sistemática nos resultados do modelo causada por dados, suposições ou escolhas de modelagem distorcidas.
Quão claramente a lógica, as fontes de dados e as limitações de um sistema de IA são documentadas e compreensíveis.
Rótulos ou metadados adicionados por humanos usados para treinar ou avaliar modelos de aprendizado de máquina.
Uma maneira estruturada de um sistema de software enviar solicitações e receber respostas de outro sistema.
O amplo campo de construção de sistemas que executam tarefas que exigem reconhecimento de padrões, raciocínio, linguagem ou tomada de decisão.
Um componente do modelo que se concentra dinamicamente em partes relevantes de uma entrada ao produzir uma saída.
Um sistema que pode tomar decisões e agir com controle humano direto limitado ou inexistente em tempo real.
O algoritmo de treinamento principal que atualiza os pesos do modelo propagando erros de previsão para trás pela rede.
Um modelo de referência simples usado para comparar se abordagens mais complexas realmente melhoram os resultados.
Um teste padronizado ou conjunto de dados usado para medir e comparar o desempenho do modelo.
Um padrão consistente de erro ou injustiça nos dados ou no comportamento do modelo.
Conjuntos de dados muito grandes e complexos que requerem técnicas escalonáveis de armazenamento e processamento.
Um modelo cujo raciocínio interno é difícil de interpretar diretamente pelos humanos.
Quão bem as pontuações de confiança de um modelo correspondem às probabilidades reais de correção.
Um estilo de raciocínio em que um modelo de IA decompõe um problema em etapas intermediárias.
Uma tarefa em que um modelo atribui uma entrada a uma ou mais categorias predefinidas.
Um modelo projetado especificamente para tarefas de classificação.
Uma arquitetura de modelo multimodal que aprende representações compartilhadas entre texto e imagens.
Os recursos de processamento necessários para treinar e executar modelos, geralmente medidos em FLOPS ou horas de GPU.
O ramo da IA que extrai significado de imagens e vídeos.
A quantidade máxima de tokens de entrada que um modelo de linguagem pode processar de uma só vez.
Abordagens de treinamento que permitem que um modelo continue aprendendo com novos dados sem esquecer o conhecimento prévio.
Uma arquitetura neural otimizada para processar dados semelhantes a grades, como imagens.
Uma função objetivo comum usada para treinar modelos de classificação penalizando probabilidades incorretas.
Técnicas que criam exemplos de treinamento modificados para melhorar a generalização do modelo.
Uma mudança nos dados de entrada do mundo real ao longo do tempo que pode degradar o desempenho do modelo.
O processo de atribuição de tags ou resultados alvo a dados brutos para aprendizagem supervisionada.
Uma coleção de exemplos estruturados ou não estruturados usados para treinamento, validação ou teste.
A superfície no espaço de recursos que separa as classes previstas por um classificador.
Um modelo que faz previsões por meio de uma sequência de divisões de recursos se-então.
Um subconjunto de aprendizado de máquina que usa redes neurais de muitas camadas para aprendizado de representação.
Uma arquitetura generativa que aprende a reverter o ruído para sintetizar imagens, áudio ou outro conteúdo.
Comprimir o conhecimento de um modelo de professor grande em um modelo de aluno menor.
Métodos que transferem um modelo treinado em um domínio para ter melhor desempenho em outro domínio.
Uma representação vetorial numérica que captura o significado semântico de texto, imagens ou outros dados.
O componente de um modelo que transforma entradas em representações latentes.
Combinar previsões de vários modelos para melhorar a robustez ou a precisão.
Um conjunto de dados mantido usado para medir a qualidade do modelo após o treinamento.
O grau em que o comportamento de um modelo pode ser interpretado e explicado aos humanos.
Uma previsão incorreta em que um modelo perde um caso verdadeiro positivo.
Uma previsão incorreta em que um modelo sinaliza incorretamente um caso negativo como positivo.
Uma variável de entrada usada por um modelo para fazer previsões.
Projetar ou transformar variáveis de entrada para tornar o aprendizado mais fácil e eficaz.
Converter dados brutos em recursos informativos que um modelo pode usar.
Aprender ou adaptar comportamento a partir de apenas um pequeno número de exemplos.
Treinamento contínuo em dados específicos de domínio para adaptar um modelo pré-treinado a uma tarefa específica.
Um grande modelo pré-treinado que pode ser adaptado a muitas tarefas posteriores.
Um recurso de modelo para gerar chamadas estruturadas que acionam ferramentas ou APIs externas.
Uma configuração generativa onde um gerador e um discriminador treinam um contra o outro.
O desempenho de um modelo em dados novos e não vistos fora do conjunto de treinamento.
Sistemas de IA que produzem novos conteúdos, como texto, imagens, áudio, vídeo ou código.
Um vetor que mostra quanto cada parâmetro deve mudar para reduzir a perda.
Um método de otimização que atualiza os parâmetros na direção que reduz o erro.
Rótulos de referência confiáveis usados para treinar ou avaliar os resultados do modelo.
Regras, verificações e controles que limitam o comportamento inseguro ou indesejado do modelo.
Quando um modelo gera informações fluentes, mas falsas ou sem suporte.
Um fluxo de trabalho onde humanos revisam, orientam ou substituem os resultados da IA.
Um valor de configuração definido antes do treinamento, como taxa de aprendizagem, tamanho do lote ou profundidade.
A capacidade de um modelo de seguir padrões de exemplos fornecidos diretamente no prompt.
A fase de tempo de execução em que um modelo treinado gera previsões ou resultados.
A quantidade de energia de processamento consumida ao produzir cada resposta.
Ajustando um modelo em pares instrução-resposta para melhorar o acompanhamento de tarefas.
Prever o propósito do usuário a partir de uma consulta de texto para encaminhá-lo corretamente.
Uma técnica imediata destinada a contornar as restrições de segurança de um modelo.
O último momento refletido nos dados de treinamento de um modelo.
Treinar um modelo menor para imitar os resultados de um modelo maior.
Uma estrutura gráfica de entidades e relacionamentos usada para raciocínio ou recuperação.
Um método de regularização que suaviza rótulos rígidos para melhorar a generalização.
O tempo entre o envio de uma solicitação e o recebimento da saída do modelo.
Um modelo de linguagem treinado em corpora de texto massivo para gerar e analisar texto.
Um hiperparâmetro de treinamento que controla quanto os parâmetros mudam em cada etapa de atualização.
Um método de ajuste fino com parâmetros eficientes que adiciona matrizes adaptadoras de classificação baixa.
Um objetivo matemático que quantifica o erro de previsão durante o treinamento.
Métodos que permitem que os sistemas aprendam padrões a partir dos dados e melhorem com o tempo.
Contexto armazenado que um agente de IA usa em etapas ou sessões para melhorar a continuidade.
Uma arquitetura com sub-redes especializadas onde apenas especialistas selecionados executam cada entrada.
Documentação que descreve o uso pretendido, métricas, limitações e riscos de um modelo.
Degradação do desempenho ao longo do tempo, à medida que as condições do mundo real divergem das suposições de treinamento.
Reduzindo a precisão numérica dos pesos do modelo para diminuir o custo de memória e inferência.
Um modelo que pode processar ou gerar vários tipos de dados, como texto, imagem e áudio.
Uma tarefa de PNL que identifica entidades como pessoas, lugares, datas ou organizações.
O ramo da IA focava na compreensão e geração da linguagem humana.
Um modelo computacional em camadas inspirado em neurônios e sinapses biológicas.
Transformando valores em uma escala consistente para melhorar a estabilidade da otimização.
Tecnologia que converte texto em imagens ou digitaliza em texto legível por máquina.
Um modelo lançado com pesos públicos ou código para inspeção, adaptação e reutilização.
Quando um modelo memoriza dados de treinamento e tem um desempenho ruim em entradas invisíveis.
Um peso aprendido dentro de um modelo que influencia seus resultados.
Métodos que adaptam modelos treinando um pequeno subconjunto de parâmetros adicionados.
Uma métrica de modelo de linguagem que mede o quão surpreso o modelo fica com os próximos tokens verdadeiros.
Um fluxo de trabalho ordenado de pré-processamento, etapas do modelo e estágios de pós-processamento.
A proporção de positivos previstos que estão realmente corretos.
Treinamento inicial de modelos em grande escala sobre dados amplos antes da adaptação posterior.
As instruções de entrada e o contexto fornecidos a um modelo generativo.
Projetar prompts para melhorar a qualidade, confiabilidade e controlabilidade da saída.
Um padrão de ataque em que instruções maliciosas são inseridas nas entradas do modelo ou no conteúdo recuperado.
Removendo pesos de modelo ou neurônios menos importantes para reduzir o tamanho e a computação.
Converter pesos de modelo em formatos de menor precisão, como 8 ou 4 bits.
Um método que recupera conhecimento externo e o alimenta na geração no momento da inferência.
A proporção de positivos reais que um modelo identifica corretamente.
Um pipeline de modelo que prevê as preferências do usuário para classificar conteúdo ou produtos.
Teste de estresse de um sistema de IA com avisos adversários para revelar falhas e riscos.
Treinamento por sinais de recompensa onde um agente aprende ações que maximizam o retorno a longo prazo.
Um método de treinamento que usa sinais de preferência humana para moldar o comportamento do modelo.
Encontrar documentos ou registros relevantes de uma fonte de conhecimento para uma consulta.
Um modelo que pontua resultados com base em sinais de preferência, frequentemente usados em pipelines RLHF.
A capacidade de um modelo de manter o desempenho sob ruído, mudanças ou entradas adversárias.
Uma camada de moderação que bloqueia ou reescreve entradas ou saídas inseguras do modelo.
Uma relação empírica que mostra como o desempenho melhora com o tamanho do modelo, dados ou computação.
Pesquisa que corresponda ao significado em vez da sobreposição exata de palavras-chave, geralmente usando embeddings.
Aprendendo representações de dados não rotulados, prevendo partes mascaradas ou transformadas.
Uma tarefa de PNL que classifica o tom emocional ou a opinião do texto.
Um modelo de linguagem compacto otimizado para menor latência, custo ou uso no dispositivo.
Um modelo onde muitos parâmetros são zero ou inativos para reduzir a computação.
Treinar um modelo com exemplos rotulados que mapeiam entradas para saídas conhecidas.
Dados gerados artificialmente usados para aumentar, simular ou proteger dados de treinamento confidenciais.
Uma instrução de alta prioridade que define comportamento, política e estilo de resposta para um modelo.
Uma configuração de amostragem que controla a aleatoriedade nas saídas geradas.
Um pedaço de texto processado por modelos de linguagem, como uma palavra ou símbolo.
O processo de divisão de texto em tokens para entrada do modelo.
A capacidade de um modelo de chamar ferramentas externas, como pesquisa, calculadoras ou APIs.
Uma estratégia de decodificação que faz amostras apenas dos k próximos tokens mais prováveis.
Uma estratégia de decodificação que faz amostras do menor conjunto de tokens cujas probabilidades somam p.
Aplicar o conhecimento aprendido em uma tarefa ou domínio para melhorar outra tarefa.
Uma arquitetura neural que usa atenção para modelar relacionamentos entre sequências em paralelo.
O valor do erro do modelo calculado durante o treinamento e otimizado para baixo ao longo do tempo.
Padrões de aprendizagem a partir de dados não rotulados sem resultados alvo explícitos.
Um conjunto de dados usado durante o desenvolvimento para ajustar modelos e evitar overfitting.
Um banco de dados otimizado para armazenar e consultar vetores de incorporação de alta dimensão.
Um modelo multimodal que processa conjuntamente informações visuais e textuais.
Uso de rótulos ruidosos, heurísticos ou parciais para treinar modelos quando rótulos limpos são escassos.
Um valor numérico aprendido que dimensiona os sinais que passam por uma rede neural.
Uma representação vetorial densa de palavras que captura relações semânticas.
Técnicas e práticas para tornar as previsões de IA mais transparentes e compreensíveis.
Resolver tarefas sem exemplos específicos de tarefas, baseando-se em conhecimentos gerais prévios.
Um processo de várias etapas em que um sistema de IA planeja, executa, verifica os resultados e itera em direção a uma meta.
O quadro regulamentar baseado no risco da União Europeia para sistemas e fornecedores de IA.
O custo extra em tempo, computação ou velocidade do produto necessário para tornar os sistemas mais seguros e controláveis.
Quando exemplos de testes de benchmark ou variantes aproximadas estão presentes nos dados de treinamento, inflacionando o desempenho relatado.
Métodos para estimar relações de causa e efeito em vez de simples correlações.
Um intervalo estatístico que provavelmente contém o valor real de uma métrica de modelo medida.
Uma abordagem de treinamento e modelagem de comportamento em que os resultados do modelo são guiados por um conjunto fixo de princípios escritos.
Um registro de onde os dados vieram, como foram transformados e onde são usados.
A origem documentada, propriedade e histórico de um conjunto de dados ou artefato de modelo.
Uma técnica de privacidade que adiciona ruído estatístico para que registros individuais não possam ser inferidos de forma confiável a partir dos resultados.
Um modelo menor treinado para imitar o comportamento de um modelo maior usando menos computação na inferência.
Um modelo especializado para converter dados em vetores usados para pesquisa semântica, agrupamento e recuperação.
Uma estrutura de avaliação repetível que executa prompts, conjuntos de dados e lógica de pontuação em versões de modelo.
Um sistema gerenciado para armazenar e fornecer recursos de ML validados de forma consistente para treinamento e inferência.
O grau em que uma resposta de IA é apoiada por dados de origem ou evidências recuperadas.
Uma estratégia de geração que restringe tokens de saída a estruturas válidas ou escolhas compatíveis com políticas.
Um modelo treinado em classificações humanas para prever quais respostas os usuários provavelmente preferirão.
Uma interface de API implantada que recebe solicitações de modelo e retorna previsões em produção.
Uma coleção selecionada de documentos ou registros usados para recuperação, automação de suporte ou respostas de aterramento.
Um espaço representacional comprimido onde conceitos semelhantes são posicionados próximos uns dos outros como vetores.
Um catálogo central para controle de versão, aprovação e rastreamento de modelos em vários ambientes.
A inferência de IA é realizada localmente no hardware do usuário, em vez de em um serviço de nuvem remoto.
Lógica que valida e converte a saída do modelo em estruturas fortemente tipadas e utilizáveis por máquina.
Um padrão de prompt reutilizável com variáveis, regras de formatação e instruções específicas de tarefas.
A proporção de itens recuperados que são relevantes para a consulta do usuário.
Um argumento estruturado, apoiado por evidências, de que um sistema de IA é seguro para um contexto de utilização definido.
Executar um modelo em paralelo com o tráfego de produção sem afetar as decisões do usuário.
Saída do modelo restrita a um esquema definido, como JSON, argumentos de ferramenta ou campos digitados.
Cálculo de inferência adicional usado durante a geração de resposta para melhorar a qualidade ou o raciocínio.
Alinhar a confiança do usuário nos resultados da IA com a confiabilidade real do sistema em cada tarefa.
Preços onde os custos aumentam com chamadas de API, tokens, tempo de inferência ou computação consumida.
Uma política em que as cargas de solicitação/resposta não são armazenadas após o processamento além das janelas operacionais de curta duração.
Um método de aceleração de inferência em que um modelo pequeno propõe tokens que um modelo maior verifica em paralelo.
Tensores de chave e valor armazenados de tokens anteriores que permitem que os transformadores gerem novos tokens sem recalcular a atenção anterior.
Um protocolo aberto que permite que aplicativos de IA se conectem a ferramentas externas, fontes de dados e provedores de contexto de maneira padrão.
Um ciclo iterativo onde um agente de IA observa, planeja, age e reflete até completar uma meta ou atingir uma condição de parada.
Um padrão de solicitação que intercala etapas de raciocínio com ações de uso de ferramentas para resolver tarefas de maneira mais confiável.
Uma abordagem de raciocínio em que um modelo explora vários caminhos de solução ramificados e seleciona os mais promissores.
Um método de treinamento que ajusta modelos diretamente em pares de preferências sem a necessidade de um modelo de recompensa separado.
Uma técnica de ajuste fino que combina quantização de peso de 4 bits com adaptadores LoRA para reduzir as necessidades de memória.
Um algoritmo de atenção otimizado que reduz o uso de memória e acelera o treinamento e a inferência do transformador.
Um mecanismo transformador que executa diversas operações de atenção em paralelo para capturar diferentes tipos de relacionamentos.
Informações adicionadas aos embeddings de tokens para que os transformadores possam distinguir a ordem da sequência.
Um método de codificação posicional que gira vetores de consulta e chave para codificar posições relativas de token.
Um método de viés posicional que penaliza as pontuações de atenção com base na distância simbólica, ajudando os modelos a extrapolarem para contextos mais longos.
Um padrão de atenção em que cada token atende apenas a uma janela de tamanho fixo de tokens próximos para reduzir a computação.
Um algoritmo de tokenização de subpalavras que mescla os pares de caracteres mais frequentes em tokens reutilizáveis.
Um tokenizer independente de idioma que aprende unidades de subpalavras diretamente do texto bruto, sem pré-divisão em espaços em branco.
Algoritmos que encontram vetores próximos a uma consulta sem comparação exaustiva, trocando exatidão por velocidade.
Uma estrutura de índice baseada em gráfico para pesquisa rápida e aproximada do vizinho mais próximo em vetores de alta dimensão.
Um modelo que reordena um conjunto inicial de resultados recuperados para colocar os itens mais relevantes no topo.
Uma abordagem de recuperação que combina pesquisa por palavra-chave (lexical) com pesquisa vetorial (semântica) para melhor recuperação e precisão.
Um modelo que pontua uma consulta e um documento em uma única passagem para julgamentos de relevância de alta precisão.
Um modelo que codifica consultas e documentos em vetores separados para que possam ser comparados rapidamente em escala.
Usar um modelo de linguagem para pontuar ou comparar resultados de outros modelos durante a avaliação.
Uma métrica de avaliação de código que mede a chance de pelo menos uma das k amostras geradas passar nos testes.
Um benchmark que testa modelos de linguagem em 57 disciplinas acadêmicas e profissionais usando questões de múltipla escolha.
Uma referência de problemas de programação Python usada para medir a correção da geração de código por meio de testes unitários.
Uma referência de problemas de palavras matemáticas do ensino fundamental usado para avaliar o raciocínio passo a passo em modelos de linguagem.
Com que precisão as afirmações de um modelo correspondem às informações verificáveis do mundo real.
Referências a passagens originais ou documentos incluídos na resposta de um modelo para apoiar suas afirmações.
Incorporar um sinal detectável em texto ou mídia gerado por IA para que possa posteriormente ser identificado como produzido por máquina.
Uma fase intermediária de treinamento entre o pré-treinamento e o pós-treinamento, frequentemente usada para ajustes de capacidade ou domínio.
Etapas de treinamento aplicadas após o pré-treinamento, como ajuste de instrução, otimização de preferência e ajuste de segurança.
Uma configuração de treinamento onde um modelo melhora gerando dados por meio de interações ou competições com cópias de si mesmo.
Um método de recuperação que gera diversas variantes de consulta, recupera resultados para cada uma e funde as classificações.
Uma técnica de recuperação que reescreve a consulta do usuário em diversas variantes para melhorar a recuperação.
Um padrão de recuperação que pesquisa pequenos pedaços, mas retorna seus documentos pais maiores para um contexto mais rico.
Um algoritmo de decodificação que mantém as principais sequências candidatas em cada etapa para encontrar saídas de maior probabilidade.
Uma configuração de decodificação que reduz a probabilidade de tokens que o modelo já produziu para reduzir loops.
Uma configuração de decodificação que reduz a probabilidade de tokens proporcionalmente à frequência com que apareceram até o momento.
Uma configuração de decodificação que reduz a probabilidade de aparecimento de tokens, incentivando novos tópicos.