Na I/O 2024 o Google resolveu focar na IA generativa e não anunciou atualizações para vários dos seus principais dispositivos.
Sundar Pichai apresenta a Conferência I/O 2024 do Google
A conferência anual de desenvolvedores do Google, a I/O 2024, teve um grande foco nos modelos Gemini AI da empresa e a sua integração com vários aplicativos. O evento durou mais de duas horas e trouxe vários anúncios, mas sempre destacando o avanço das tecnologias com a IA do Google. Isso porque houve uma crescente concorrência de rivais do setor, como a OpenAI, que teve atualizações importantes para o ChatGPT. Veja abaixo um resumo da I/O 2024 e também um vídeo com resumo da apresentação.
Gemini traz IA para o ecossistema do Google
Centralizando os avanços da IA do Google, está a família Model Gemini. Portanto, o Gemini 1.5 Pro é a mais recente inclusão e possui uma impressionante janela de contexto com 1 milhão de token. Isso permite que ele processe e entenda muito mais informações, incluindo texto, imagens, vídeo e até código. Esse recurso permite que o Gemini entenda tarefas mais complexas e forneça respostas precisas e relevantes.
O Google também anunciou o Gemini 1.5 Flash, uma versão leve para aplicações de baixa latência, algo mais acessível para os desenvolvedores integrarem aos seus projetos. O Flash 1.5 Gemini estará disponível no AI Studio e na Vértice AI. Além disso, a empresa também apresentou uma janela de contexto de 2 milhões de token para o Gemini 1.5 Pro.
“Um milhão de tokens abre possibilidades inteiramente novas. É emocionante, mas acho que podemos nos esforçar ainda mais”. Então, hoje, estamos expandindo a janela de contexto para 2 milhões de tokens e disponibilizando-o para desenvolvedores em visualização privada”. Disse o Google.
A IA Transformando pesquisa e fotos do Google
Um dos anúncios mais significativos foi a integração do Gemini na pesquisa do Google, que recebeu o nome Visão Geral da IA.
O lançamento acontece nos EUA nesta semana e será expandindo para mais países em breve. Essa Visão Geral da IA fornece aos usuários respostas resumidas da Web, facilitando a localização de informações relevantes, principalmente nas consultas mais complexas.
O Google Photos também vai receber uma grande atualização de IA, com a introdução do Ask Photos. Esse recurso permite que os usuários pesquisem na sua biblioteca de fotos, mas utilizando consultas de linguagem natural, pois o Gemini vai fornecer respostas inteligentes com base no conteúdo das imagens. Ou seja, os usuários podem, por exemplo, acompanhar o progresso do futebol de seus filhos ao longo do tempo, já que o Gemini vai analisar as fotos e fornecer um resumo das informações mais relevantes.
Gemini e a produtividade
Todo o poder do Gemini 1.5 Pro está chegando ao conjunto de ferramentas de produtividade do Google. No Gmail o Gemini pode resumir conversas que chegam ao e-mail e até redigir respostas com base no conteúdo dessas mensagens. Ele também pode analisar anexos com PDF e fornecer visões gerais mais concisas, economizando um tempo valioso aos usuários, principalmente os que recebem grandes volumes de informações.
O recurso Notebooklm no Workspace também vai aproveitar o Gemini para criar conversas de áudio personalizadas e interativas, todas com base nos materiais de origem dos usuários. Isso abre novas possibilidades para consumir e se envolver com o conteúdo, que passa a ser mais acessível e eficiente.
Detecção de fraude na IA do Android
Seguindo o seu esforço contínuo para proteger os usuários, o Google anunciou a integração do Gemini Nano, uma versão mais leve do Gemini AI e que tem capacidade de realizar uma triagem de chamadas no Android. As análises dessa IA no dispositivo acontecem em tempo real, identificando padrões de conversas comuns e alertando os usuários. Essa integração da IA pretende combater proativamente a crescente ameaça de golpes telefônicos, garantindo a privacidade e a segurança de seus usuários.
Google Chrome recebe um assistente de IA
O Google está ampliando a funcionalidade do seu navegador, por isso introduziu um assistente de IA no Chrome. Alimentado pelo Gemini Nano, esta IA pode ajudar os usuários a gerar vários textos, criar postagens para redes sociais e até revisar tudo isso dentro do próprio navegador.
Aprimoramentos para Imagefx e Musicfx
O Google também anunciou atualizações de suas ferramentas criativas, o ImageFX e MusicFX. O ImageFX agora possui controles de edição que permitem que os usuários adicionem, removam ou alterem elementos específicos em suas imagens geradas. Além disso, o ImageFX vai incorporar o Imagen 3, que é o modelo de geração de imagens mais avançado do Google DeepMind. Isso vai permitir a criação de visuais altamente realistas e com detalhes bem mais ricos.
O MusicFX, ferramenta de criação musical movida pela IA do Google, agora vai ter um modo DJ, recurso que ajuda os usuários a misturar batidas, combinando vários gêneros e instrumentos. Desenvolvido em colaboração com artistas, o DJ Mode vai inspirar novas músicas, capacitando músicos profissionais e também os amadores.
Desenvolvimento de IA responsável
O Google continua a ultrapassar os limites das ferramentas e experiências alimentadas pela IA, mas a empresa ainda está comprometida em desenvolver essas tecnologias com responsabilidade, de acordo com suas políticas. Espero realmente que isso seja verdade.
Portanto, todo o conteúdo gerado através do Videofx, ImageFX e MusicFX será digitalmente marcado, garantindo transparência e responsabilidade no uso dessa mídia gerada por IA.
Com essas ferramentas aprimoradas de produtividade e projetos ambiciosos como o Astra, o Google está atualizando a maneira como os usuários interagem com essa tecnologia e as informações de acesso. A empresa continua trabalhando em conjunto com os desenvolvedores, parceiros e criadores, criando novas possibilidades movidas a IA.
No Site MobDica falamos sobre Inteligência Artificial