MaisTecnologia MaisTecnologia
  • Home
  • Notícias
    • Casa & Família
    • Motores
    • Computadores
      • Hardware
      • Periféricos
      • Segurança
      • Software
    • Comunicações
      • Telemóveis
    • Diversos
      • Apple
      • Google
      • Microsoft
      • Negócios
      • Gadgets
      • Portabilidade
    • Eventos
    • Internet
      • Sites
    • Multimedia
      • Podcast
      • Video
      • Imagem
      • Som
    • Redes Sociais
    • Promoções
    • SmartHome
  • Análises
Subscrever Newsletter
Search the Site
Popular Searches:
Adventure Samsung Community
Recent Posts
Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos
9 de Junho de 2026
Apple revela a maior mudança da Siri na WWDC 2026
9 de Junho de 2026
macOS 27 Golden Gate traz mais IA e abandona os Macs Intel
9 de Junho de 2026
MaisTecnologia MaisTecnologia
  • Home
  • Notícias
    • Casa & Família
    • Motores
    • Computadores
      • Hardware
      • Periféricos
      • Segurança
      • Software
    • Comunicações
      • Telemóveis
    • Diversos
      • Apple
      • Google
      • Microsoft
      • Negócios
      • Gadgets
      • Portabilidade
    • Eventos
    • Internet
      • Sites
    • Multimedia
      • Podcast
      • Video
      • Imagem
      • Som
    • Redes Sociais
    • Promoções
    • SmartHome
  • Análises

Receba as novidades tecnológicas no conforto do seu email!

Subscrever Newsletter

© All Rights Reserved, MaisTecnologia

Home/Diversos/Apple/Apple Rouba Dados do YouTube para Treinar IA
Apple

Apple Rouba Dados do YouTube para Treinar IA

Tiago Carvalho
25 de Julho de 2024 2 Min Read

G
Adiciona MaisTecnologia como fonte preferida no Google

Nos últimos anos, os chatbots e outras aplicações de inteligência artificial (IA) têm evoluído de forma impressionante, demonstrando capacidades notáveis em manter conversas fluidas, responder a perguntas e analisar dados. No entanto, para alcançar este nível de sofisticação, as empresas de IA necessitam de treinar os seus modelos de linguagem com vastas quantidades de dados.

Este processo de treinamento é, atualmente, um tema controverso, especialmente devido à falta de transparência sobre a origem desses dados.

Segue-nos no Google News

A Origem dos Dados de Treinamento

Recentemente, uma investigação da Proof News revelou que empresas como Apple, Anthropic, Nvidia e Salesforce utilizaram dados do YouTube para treinar os seus modelos de IA. Esta descoberta levanta questões importantes sobre a ética e a legalidade do uso de tais dados.

Subtítulos do YouTube como Fonte de Dados

De acordo com o relatório, uma organização sem fins lucrativos chamada EleutherAI recolheu os subtítulos de 173.536 vídeos do YouTube, provenientes de mais de 48.000 canais. Estes dados, que consistem em texto sem formatação e, muitas vezes, incluem traduções para diferentes idiomas, foram utilizados para criar um conjunto de dados denominado “YouTube Subtitles”.

Este conjunto de dados inclui material de criadores de conteúdo populares como MrBeast e Marques Brownlee, bem como de canais educativos como Khan Academy, MIT e Harvard. Os subtítulos do YouTube fazem parte de um conjunto de dados maior chamado “Pile”, que é composto por 22 conjuntos de dados, incluindo material do Parlamento Europeu e da Wikipedia em inglês.

A Utilização dos Dados

O Pile está disponível ao público, permitindo que académicos e empresas utilizem estes dados para os seus projetos de IA. As empresas mencionadas anteriormente não obtiveram os dados diretamente do YouTube, mas sim através do trabalho realizado pela EleutherAI.

Os Termos de Serviço do YouTube

Este cenário levanta questões sobre o papel dos termos de serviço do YouTube. No início do segundo trimestre do ano, o CEO do YouTube, Neal Mohan, esclareceu que, embora certos conteúdos do YouTube, como títulos de vídeos e nomes de canais, possam ser raspados para aparecer nos motores de busca, as regras atuais não permitem a descarga de vídeos ou das suas transcrições.

As transcrições, que são a matéria-prima dos subtítulos, contêm o texto do que é dito nos vídeos. Mohan afirmou que a descarga de transcrições ou fragmentos de vídeos constitui uma “clara infração” dos termos de serviço da plataforma.

A Questão da Responsabilidade

A questão central aqui é: quem é responsável pela infração, se é que existe uma? Embora o relatório indique que Apple, Anthropic, Nvidia e Salesforce utilizaram subtítulos do YouTube para treinar os seus modelos, estas empresas não foram as responsáveis pela raspagem dos dados. Essa tarefa foi realizada pela EleutherAI. Portanto, a responsabilidade pela possível infração dos termos de serviço do YouTube recai sobre quem?

Etiquetas

appleyoutube

Gostou? Partilhe Artigo com os seus amigos!

Tiago Carvalho

32 anos, apaixonado por tecnologia e inovação. Gosta de se manter ativo através do desporto e valoriza um estilo de vida equilibrado. É uma pessoa alegre, divertida e sempre pronta para novos desafios e experiências.

Anterior

Quer saber mais sobre uma VPS Windows? Leia este guia

Próximo

Revolução Apple Store: Nova Secção “Para Ti” Transforma a Experiência do Utilizador

Sem Comentários! Seja o Primeiro.

Deixe um comentário Cancelar resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Redes Sociais
Facebook
Instagram
X
Telegram
Análises
9 de Junho de 2026
Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos
29 de Maio de 2026
Análise Xiaomi Watch S5: review completa ao smartwatch que dura mais de 20 dias
29 de Maio de 2026
Análise Xiaomi 17T: o equilíbrio que faltava na gama média premium
21 de Maio de 2026
Análise HP Smart Tank 6005: impressora para imprimir muito e gastar pouco
21 de Maio de 2026
Análise Huawei Watch Fit 5 Pro: a smartband que já pensa como smartwatch
9 de Maio de 2026
Ensaio Hyundai Kauai HEV 2025: Análise a um dos híbridos mais equilibrados do mercado?
Destaques

Apple revela a maior mudança da Siri na WWDC 2026

9 de Junho de 2026

iOS 27 já é oficial: Siri muda tudo no iPhone

9 de Junho de 2026
Ícone do Microsoft Word em 3D com efeito de brilho azul, representando o software de processamento de texto da Microsoft, utilizado para criar, editar e formatar documentos.

Office no Mac vai perder funções já em 2026

2 de Junho de 2026
Processador Qualcomm Snapdragon 9 IQ-X, tecnologia avançada para desempenho superior em dispositivos móveis.

Qualcomm revela plataforma para robôs com IA

1 de Junho de 2026
Imagem de um tablet com tela de alta resolução, exibindo uma interface moderna, sendo segurado por uma pessoa em um ambiente interno com iluminação suave.

Apple prepara 2 novidades que podem mudar o iPad

31 de Maio de 2026
Pessoa segurando uma rosa seca com uma mão, destacando detalhes das mãos e do anel de casamento, simbolizando despedida ou nostalgia.

Oura Ring 5 chega mais fino e com nova aposta na IA

30 de Maio de 2026

Últimas Notícias

Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos

Apple revela a maior mudança da Siri na WWDC 2026

macOS 27 Golden Gate traz mais IA e abandona os Macs Intel

iPadOS 27 chega com Siri AI e muito mais rapidez

Motores

Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos

Polestar 3 chega a Portugal com carga mais rápida

LG e Google querem mudar o ecrã do seu próximo carro

Zeekr chega a Portugal e estreia o novo 7GT

Gaming

Pokémon Champions chega ao iPhone e Android este mês

Nave de jogos Predator Atlas com tela touchscreen, controlos laterais e design futurista, ideal para gamers que procuram desempenho e inovação em dispositivos portáteis de alta tecnologia.

Acer Predator Atlas 8 quer mudar as consolas portáteis

Veículo de alta performance inspirado em carros de corrida, com design aerodinâmico e detalhes tecnológicos avançados, em um estádio de futebol com iluminação vibrante.

Epic mostra Unreal Engine 6 com Rocket League

A imagem mostra uma pessoa segurando um smartphone com uma tela amarela, em um ambiente de sala de aula ou auditório, com o logotipo da Nintendo no canto superior esquerdo.

Nintendo lança Pictonico e transforma fotos em minijogos

MaisTecnologia MaisTecnologia

Fundado em 2008, o MaisTecnologia é um portal que se dedica à divulgação de informação na área da tecnologia e ciência.

Parceiros
Imagem de um painel de tecnologia e-Ink no rodapé do site, destacando a inovação em displays de baixo consumo energético.
Trending
Samsung mostra o primeiro monitor 4K 360Hz QD-OLED
Meta prepara vários óculos inteligentes para 2026

MaisTecnologia

  • Sobre nós
  • Privacidade
  • Cookies
  • Estatuto Editorial
  • Contactos

MaisTecnologia - Marca Registada