O que são modelos de base para IA?

Publicado 14 de setembro de 2023•6 minutos (tempo de leitura)

Um modelo de base é um tipo de modelo de machine learning (aprendizado de máquina)treinado previamente para realizar diversas tarefas.

Até recentemente, os sistemas de inteligência artificial (IA) eram ferramentas especializadas. Ou seja, os modelos de machine learning (ML) eram treinados para uma aplicação ou caso de uso específico. O termo modelo de base passou a fazer parte do nosso vocabulário quando especialistas começaram a observar duas tendências no campo de machine learning:

Um pequeno número de arquiteturas de deep learning sendo usado para obter resultados em uma ampla variedade de tarefas.
O surgimento de novos conceitos de um modelo de inteligência artificial (IA) que não estavam inicialmente previstos durante o seu treinamento.

Os modelos de base, como os modelos do IBM's Grantite, foram programados para funcionar com uma compreensão contextual geral de padrões, estruturas e representações. Essa compreensão fundamental de como se comunicar e identificar padrões gera uma linha de base de conhecimento que pode ser modificada ou ajustada para realizar tarefas específicas de um domínio para praticamente qualquer setor.

Mais informações sobre o Red Hat AI

Duas características essenciais para o funcionamento dos modelos base são a aprendizagem por transferência e a escala. Aprendizagem por transferência se refere à capacidade de um modelo de aplicar informações sobre uma situação a outra e desenvolver seu "conhecimento" interno.

Escala refere-se ao hardware, especificamente às unidades de processamento gráfico (GPUs), que permitem que o modelo realize vários cálculos simultaneamente, também conhecido como processamento paralelo. Por serem capazes de processar dados e fazer cálculos estatísticos complexos rapidamente, as GPUs são fundamentais para treinar e implantar modelos de deep learning, incluindo os modelos de base.

Tanto a escala quanto o treinamento estão ajudando na execução da inferência de IA. AI inference is the operational phase of AI, where the model is able to apply learning from training and apply it to real-world situations.

Deep learning e modelos base
Muitos modelos de base, principalmente os usados em processamento de linguagem natural (PNL), visão computacional e processamento de áudio são treinados com técnicas de deep learning. O deep learning é uma tecnologia que sustenta muitos modelos base (mas não todos) e impulsionou muitos avanços nesse campo. Também conhecido como aprendizado neural profundo ou rede neural profunda, ele ensina computadores a aprender por meio da observação, imitando a maneira como os humanos adquirem conhecimento.

Transformadores e modelos base
Embora nem todos os modelos base usem transformadores, uma arquitetura de transformadores provou ser uma maneira popular de criar modelos base que envolvem texto, como ChatGPT, BERT e DALL-E 2. Os transformadores aprimoram a capacidade dos modelos de ML, permitindo que eles capturem relações contextuais e dependências entre elementos em uma sequência de dados. Esse tipo de rede neural artificial (RNA) é utilizado em modelos de NLP, mas não é comum em modelos de machine learning que utilizam unicamente visão computacional ou modelos de processamento de fala.

Depois que um modelo de base é treinado, ele utiliza o conhecimento adquirido de enormes pools de dados para resolver problemas. Essa habilidade pode oferecer insights e contribuições relevantes para as organizações de muitas maneiras. Estas são algumas das tarefas gerais que esses modelos podem executar:

Processamento de linguagem natural (PNL)
Reconhecendo contexto, gramática e estruturas linguísticas, um modelo de base treinado em PNL pode gerar e extrair informações dos dados com os quais são treinados. Treinar um modelo de NPL para associar textos a sentimentos (positivos, negativos ou neutros) pode ser útil para empresas que querem analisar o conteúdo de mensagens escritas, como feedback dos clientes, comentários ou publicações em redes sociais. A NLP é um campo mais amplo que engloba o desenvolvimento e a aplicação de grandes modelos de linguagem (LLMs).

Visão computacional
Quando o modelo é capaz de reconhecer formas e características básicas, ele pode começar a identificar padrões. É possível ajustar um modelo de visão computacional para realizar moderação de conteúdo automatizada, reconhecimento facial e classificação de imagens. Esses modelos também podem gerar novas imagens com base nos padrões aprendidos.

Processamento de áudio/fala
Quando um modelo é capaz de reconhecer elementos fonéticos, ele pode extrair significado de nossas vozes, permitindo uma comunicação mais eficiente e inclusiva. Assistentes virtuais, suporte em diferentes idiomas, comandos de voz e funcionalidades como transcrição promovem a acessibilidade e a produtividade.

Com ajustes finos, organizações podem desenvolver sistemas de machine learning especializados para atender a necessidades específicas do setor, como detecção de fraudes para instituições financeiras, sequenciamento genético para a área da saúde, chatbots para atendimento ao cliente e muito mais.

Os modelos de base fornecem acessibilidade e um nível de sofisticação no campo da IA que muitas organizações não têm recursos para alcançar por conta própria. Com a adoção e criação de modelos base, as empresas podem superar desafios típicos, como:

Acesso limitado a dados de qualidade: os modelos base são criados a partir de dados aos quais a maioria das organizações não tem acesso.

Desempenho/precisão do modelo: modelos de base oferecem uma precisão que uma organização levaria meses ou até mesmo anos para obter por conta própria.

Time to value (TTV): treinar um modelo de machine learning pode levar muito tempo e exige muitos recursos. Os modelos base oferecem um treinamento inicial que as organizações podem ajustar para obter um resultado sob medida.

Limitação de talentos: com modelos base, as organizações podem utilizar inteligência artificial e machine learning sem precisar fazer grandes investimentos em recursos de ciência de dados.

Gerenciamento de despesas: usar um modelo base reduz a necessidade de hardwares caros necessários para o treinamento inicial. Os custos para ajustar e disponibilizar o modelo finalizado são apenas uma fração do que custaria treinar o modelo base.

Explicação de LoRA x QLoRA

Embora existam muitas aplicações fascinantes para modelos base, também há vários desafios em potencial a serem considerados.

Custo
É necessário investir recursos significativos para desenvolver, treinar e implantar modelos de base. A fase inicial de treinamento desses modelos demanda grandes quantidades de dados genéricos, consome dezenas de milhares de GPUs e, muitas vezes, requer um grupo de engenheiros de machine learning e cientistas de dados.

Interpretabilidade
Efeito "caixa preta" é quando um programa de IA executa uma tarefa em sua rede neural, mas não mostra o processo de trabalho. Isso cria um cenário em que ninguém, incluindo os cientistas e engenheiros de dados que criaram o algoritmo, consegue explicar como o modelo chegou a um resultado específico. A ausência de interpretabilidade em modelos de caixa preta pode gerar consequências graves em cenários de tomada de decisões importantes, especialmente em setores como saúde, justiça criminal ou financeiro. Esse efeito de caixa preta pode ocorrer em qualquer modelo baseado em redes neurais, não apenas em modelos base.

Privacidade e segurança
Os modelos base exigem acesso a muitas informações e, às vezes, isso inclui dados de clientes ou dados corporativos proprietários. Isso é algo com que se deve ter um cuidado especial, principalmente se o modelo for implantado ou acessado por entidades terceiras.

Precisão e viés
Se um modelo de deep learning for treinado com dados estatisticamente enviesados ou não oferecer uma representação precisa da população, o resultado poderá apresentar falhas. Infelizmente, é comum que o viés humano seja transferido para a inteligência artificial, o que pode criar algoritmos e resultados discriminatórios. À medida que as organizações continuam a explorar a IA para melhorar o desempenho e a produtividade, é fundamental implementar estratégias para minimizar os vieses. Isso começa com processos de design inclusivos e uma consideração mais cuidadosa sobre a representação da diversidade nos dados coletados.

Considerações para IA/ML

O Red Hat® AI é nosso portfólio de produtos de IA, desenvolvido com base em soluções em que nossos clientes confiam.

O Red Hat AI pode ajudar as organizações a:

Adotar a IA e inovar rapidamente.
Reduzir as complexidades da entrega de soluções de IA.
Implante em qualquer ambiente.

Conheça o Red Hat AI

Acesso fácil aos modelos da família IBM's IBM's IBM's IBM

Se você está pronto para experimentar modelos base, mas ainda não tem certeza de quais são seus casos de uso empresariais, comece com o Red Hat® Enterprise Linux® AI. Essa plataforma modelo base ajuda a desenvolver, testar e executar os LLMs da famíliado granite para aplicações empresariais.

Os desenvolvedores têm acesso rápido a um único ambiente de servidor, com LLMs e conjuntos de ferramentas de IA. Com ela, você tem o necessário para ajustar modelos e criar aplicações de gen AI.

A Red Hat AI também oferece mecanismos adicionais de alinhamento de modelos para melhorar seu LLM com uma solução chamada InstructLab. A Red Hat e a IBM criaram o InstructLab para introduzir uma abordagem open source orientada pela comunidade para aprimorar os recursos dos LLMs.

Conheça o Red Hat Enterprise Linux AI

Participe e aprenda

Soluções por setor de atividade

Plataforma

Em destaque

Teste e compre

Serviços

Treinamento e certificação

Em destaque

Tópicos

Artigos

Consulte também

Para clientes

Para parceiros

Informações sobre a empresa

Open source

Sobre a Red Hat

Leitura recomendada

Selecione um idioma

Selecione um idioma

O que são modelos de base para IA?

O que é um modelo de base?

Como os modelos de base funcionam?

Casos de uso de modelos de base

Por que adotar modelos base traz vantagens para as empresas?

Quais desafios as empresas enfrentam ao adotar modelos base?

Como a Red Hat pode ajudar

Acesso fácil aos modelos da família IBM's IBM's IBM's IBM

Leia mais

O que é ajuste fino de parâmetros com eficiência (PEFT)?

LoRA e QLoRA

O que é vLLM?

Inteligência artificial: leitura recomendada

Produtos

Ferramentas

Experimente, compre, venda

Comunicação

Sobre a Red Hat

Selecione um idioma

Red Hat legal and privacy links

Red Hat legal and privacy links

Participe e aprenda

Soluções por setor de atividade

Plataforma

Em destaque

Teste e compre

Serviços

Treinamento e certificação

Em destaque

Tópicos

Artigos

Consulte também

Para clientes

Para parceiros

Informações sobre a empresa

Open source

Sobre a Red Hat

Leitura recomendada

Selecione um idioma

Selecione um idioma

O que são modelos de base para IA?

Recursos da Red Hat

Acesso fácil aos modelos da família IBM's IBM's IBM's IBM

Blog da Red Hat

Teste as soluções da Red Hat

Leia mais

O que é ajuste fino de parâmetros com eficiência (PEFT)?

LoRA e QLoRA

O que é vLLM?

Inteligência artificial: leitura recomendada

Produtos

Ferramentas

Experimente, compre, venda

Comunicação

Sobre a Red Hat

Selecione um idioma

Red Hat legal and privacy links

Red Hat legal and privacy links