Notícia nº 33

O desafio dos “dados tóxicos” no desenvolvimento de IA

Especialistas alertam: sem qualidade informacional, projetos de inteligência artificial podem falhar antes mesmo de começar

No cenário atual da inteligência artificial, um ponto crucial começa a ganhar cada vez mais destaque: a qualidade dos dados. Durante o AI+IM Global Summit, realizado em Atlanta, o conceito de “dados tóxicos” esteve no centro dos debates — especialmente entre gestores de informação e especialistas em governança digital.

Mas afinal, o que são dados tóxicos? São conteúdos de baixa qualidade, mal estruturados ou imprecisos que contaminam grandes volumes de informação usados no treinamento de modelos de IA. Basta uma pequena fração de documentos inadequados para comprometer a eficácia do modelo inteiro, tornando-o enviesado, ineficaz ou até perigoso em decisões críticas. O problema é ainda mais relevante quando se trata de dados não estruturados — e-mails, PDFs, planilhas, imagens e outros arquivos corporativos, que representam a maior parte das informações geradas pelas empresas.

Alan Pelz-Sharpe, especialista da AIIM, reforça que os profissionais de gestão da informação estão entre os mais preparados para enfrentar esse desafio. Eles conhecem onde os dados estão, como circulam, quais são sensíveis e como devem ser governados. Apesar disso, muitas vezes são ignorados nos projetos de IA, o que se revela um erro estratégico. A fragmentação típica da indústria de tecnologia — entre TI, automação, ERP, CRM e áreas de dados — não se sustenta no universo da inteligência artificial, que exige integração e colaboração.

A boa notícia é que essa percepção começa a mudar. Eventos como o AI+IM Summit mostram que há um movimento crescente para aproximar os gestores de informação dos times de inovação e ciência de dados. Essa união é essencial para garantir confiabilidade, conformidade regulatória (como a LGPD) e relevância no uso de dados para treinar modelos de IA.

Segundo Pelz-Sharpe, cabe a esses especialistas contribuir em pontos estratégicos, como:

  • Identificar fontes confiáveis de dados não estruturados;

  • Eliminar conteúdos redundantes, obsoletos ou irrelevantes (ROT);

  • Garantir conformidade com legislações e normas de privacidade;

  • Estabelecer taxonomias e metadados adequados para treinar algoritmos.

A mensagem final é clara: a IA não pode ser tratada apenas como um projeto de cientistas de dados e engenheiros. Ela precisa de bases sólidas — e isso depende da gestão eficaz da informação. Na era da inteligência artificial, colaboração é o que importa. Silos, definitivamente, não têm espaço.

CONTATO

Email: contato@iima.com.br | Telefone: (11) 3392-4111

Endereço: Rua do Bosque, 1589 – Conjs. 809 e 810
Barra Funda - São Paulo/SP | CEP 01136-001

SiteLock