O Google Translate continua a revolucionar a forma como nos conectamos e entendemos o mundo ao nosso redor, quebrando barreiras linguísticas e permitindo uma comunicação mais eficiente entre pessoas de diferentes culturas. Em 2022, a plataforma avançou significativamente ao adicionar 24 novos idiomas utilizando a tradução automática sem exemplos prévios, uma técnica conhecida como Zero-Shot Machine Translation.
Com isso, o Google deu início à Iniciativa dos 1.000 Idiomas, um compromisso de construir modelos de IA que suportem as 1.000 línguas mais faladas do mundo.
Agora, o Google Translate está expandindo ainda mais seu suporte linguístico. Com a ajuda do modelo de linguagem avançado PaLM 2, estamos lançando suporte para 110 novos idiomas, marcando a maior expansão da história do serviço.
Ampliando o Alcance para Mais de Meio Bilhão de Pessoas
Esta expansão é monumental, abrangendo mais de 614 milhões de falantes ao redor do mundo, o que representa cerca de 8% da população global. Entre os novos idiomas, alguns são amplamente falados, enquanto outros são línguas de comunidades indígenas ou idiomas quase extintos em processo de revitalização. Aproximadamente um quarto desses novos idiomas são originários da África, como Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Destaques dos Novos Idiomas Suportados
Afar
Falado em Djibouti, Eritreia e Etiópia, o Afar é um idioma tonal que contou com a maior contribuição voluntária da comunidade para ser incluído nesta expansão.
Cantonês
Muito solicitado pelos usuários do Google Translate, o Cantonês apresenta desafios únicos devido à sua sobreposição com o Mandarim na escrita, dificultando a obtenção de dados e o treinamento de modelos.
Manx
A língua celta da Ilha de Man quase foi extinta em 1974 com a morte de seu último falante nativo. No entanto, um movimento de revitalização na ilha trouxe de volta milhares de falantes.
NKo
Uma forma padronizada das línguas Manding da África Ocidental, o NKo unifica muitos dialetos em uma língua comum com um alfabeto único, criado em 1949.
Punjabi (Shahmukhi)
Variante do Punjabi escrita em alfabeto Perso-Árabe, é a língua mais falada no Paquistão.
Tamazight (Amazigh)
Idioma Berbere falado em toda a África do Norte, com diversas dialetos, mas uma forma escrita geralmente compreensível, suportada tanto no script Latino quanto no Tifinagh.
Tok Pisin
Crioulo baseado no inglês e a língua franca da Papua Nova Guiné. Se você fala inglês, pode tentar traduzir para Tok Pisin e entenderá grande parte do significado!
Escolhendo Variedades Linguísticas
Adicionar novos idiomas ao Google Translate envolve uma análise detalhada de diversas variações regionais, dialetos e padrões de ortografia. Muitas línguas não possuem uma forma padrão única, o que torna impossível escolher uma variedade “correta”. A abordagem do Google é priorizar as variedades mais usadas.
Por exemplo, a língua Romani tem muitos dialetos em toda a Europa, e os modelos do Translate produzem textos mais próximos do Romani Vlax do Sul, mas também incorporam elementos de outros dialetos como o Vlax do Norte e o Romani Balcânico.
O modelo PaLM 2 foi crucial para ajudar o Translate a aprender de maneira mais eficiente idiomas que são linguisticamente próximos, incluindo línguas próximas ao Hindi, como Awadhi e Marwadi, e crioulos franceses como o Crioulo das Seychelles e o Crioulo Mauriciano. Com o avanço da tecnologia e a contínua parceria com linguistas e falantes nativos, o Google planeja suportar ainda mais variedades linguísticas e convenções ortográficas ao longo do tempo.
Agora com Português de Portugal
Quem nunca precisou de fazer uma tradução de algum tempo e o resultado veio, claramente, com palavras e expressões do Brasil? Alias, a própria Google tinha a indicação de que se tratava de Português do Brasil, mas finalmente adicionou suporte ao nosso português.
Nas apps para Android, iOS ou na versão web, já é possível encontrar a opção de Português de Portugal como o resultado da tradução.
Conclusão
O Google Translate continua a evoluir, expandindo suas capacidades e alcançando mais pessoas ao redor do mundo. Com a inclusão de 110 novos idiomas, a plataforma reforça seu compromisso de quebrar barreiras linguísticas e facilitar a comunicação global, conectando pessoas de diversas culturas e promovendo um entendimento mais profundo entre os povos.