본문 바로가기
AI

Google I/O 발표의 모든 것 정리! 이거만 보면 됨!

by AICC 2024. 5. 15.
반응형

구글 I/O 2024, 연례 개발자 회의에서는 AI, 클라우드 서비스, 스마트 기기와의 상호작용을 새롭게 정의할 최첨단 기술과 혁신들이 소개되었습니다. 이번 행사에서 발표된 주요 내용을 종합적으로 정리해 보겠습니다.

Gemini 1.5 Flash와 Pro: 새로운 기능과 통합

구글은 이번 I/O에서 Gemini 1.5 Flash를 새롭게 선보였습니다. Flash는 빠르고 빈번한 작업에 최적화된 모델로, Gemini 1.5 Pro에 비해 작지만 효율적입니다. 이 모델은 번역, 추론, 코딩 등의 기능을 강화하여 빠른 응답이 필요한 애플리케이션에 이상적입니다. 특히 Gemini 1.5 Pro의 컨텍스트 윈도우가 100만 토큰에서 200만 토큰으로 두 배 증가하여 더 많은 정보를 효과적으로 처리할 수 있게 되었습니다. 이를 통해 더 긴 문서나 코드베이스, 비디오, 오디오 녹음 등을 분석할 수 있는 능력이 향상되었습니다.

Project Astra: AI 어시스턴트의 미래

Project Astra는 AI 어시스턴트를 다중 모달 에이전트로 발전시키는 것을 목표로 하고 있습니다. 이 AI는 기기의 카메라를 통해 주변 환경을 인식하고, 사물의 위치를 기억하며, 사용자를 대신해 다양한 작업을 수행할 수 있습니다. 예를 들어, 방 안의 물건 위치를 파악하거나, 일정을 관리하고, 쇼핑 목록을 작성하는 등의 작업을 수행할 수 있습니다. Astra는 단순히 대화형 AI를 넘어 실제로 실생활에서 사용자의 다양한 요구를 해결하는 진정한 AI 어시스턴트로 발전할 것입니다.

Veo: 고급 AI 생성 동영상 제작

구글의 새로운 생성형 AI 모델인 Veo는 동영상 콘텐츠 제작에 혁신을 불러올 것입니다. Veo는 텍스트, 이미지, 동영상 프롬프트를 사용하여 1080p 해상도의 동영상을 제작할 수 있으며, 항공 촬영, 타임랩스, 드라마틱한 장면 등 다양한 스타일의 영상을 생성할 수 있습니다. 현재 일부 유튜브 크리에이터에게 제공되고 있으며, 향후 영화 제작에서도 활용될 가능성이 큽니다. Veo는 기존의 이미지 생성 모델인 Imagen 2를 기반으로 하며, 더 발전된 영상 생성 기능을 제공합니다.

Google Workspace와 Gemini 통합

Google Workspace에 통합된 Gemini 1.5 Pro는 사용자에게 더 강력한 생산성 도구를 제공합니다. 사용자는 이메일 작성, 문서 요약, 정보 추출 등 다양한 작업을 Gemini를 통해 수행할 수 있습니다. 예를 들어, Drive에서 문서를 검색하여 필요한 정보를 추출하고, 이를 바탕으로 Gmail에서 이메일을 작성하거나, Sheets에서 데이터를 분석하여 보고서를 작성할 수 있습니다. 이러한 통합은 사용자에게 더 효율적인 작업 환경을 제공하며, 다음 달부터 유료 구독자에게 제공될 예정입니다.

Google Lens와 Photos 기능 확장

Google Lens는 이제 비디오 검색 기능을 추가하여 사용자가 비디오를 촬영하면서 질문을 하면 실시간으로 웹에서 관련 답변을 제공합니다. 예를 들어, 특정 식물의 이름을 묻거나, 제품의 사용 방법을 질문할 수 있습니다. Google Photos는 올 여름 출시 예정인 "Ask Photos" 기능을 통해 사용자의 사진 라이브러리를 분석하여 자연어 질문에 답변할 수 있습니다. 예를 들어, 특정 날의 사진을 찾거나, 특정 이벤트의 사진을 검색할 수 있습니다.

Gemini Gems: 맞춤형 챗봇 생성

Gemini Gems 기능을 통해 사용자는 자신만의 맞춤형 챗봇을 생성할 수 있습니다. 사용자는 원하는 응답 방식과 전문 분야를 설정하여 자신에게 맞는 챗봇을 만들 수 있습니다. 예를 들어, 매일 동기 부여와 달리기 계획을 제공하는 챗봇을 만들 수 있으며, 이는 Gemini Advanced 구독자에게 제공됩니다. 이 기능은 사용자가 필요로 하는 다양한 요구를 충족시킬 수 있는 맞춤형 솔루션을 제공합니다.

Gemini Live: 향상된 대화형 AI

Gemini Live는 음성 채팅 상호작용을 더 자연스럽고 동적이게 만듭니다. 사용자는 중간에 말을 끊거나, 질문을 던질 수 있으며, Gemini는 이를 실시간으로 인식하고 반응합니다. 또한, 스마트폰 카메라를 통해 실시간으로 정보를 제공받아 더 정확한 답변을 제공할 수 있습니다. 예를 들어, 특정 위치의 사진을 보여주고 이에 대한 정보를 얻거나, 특정 상황에 대한 도움을 받을 수 있습니다. Gemini Live는 Google Calendar, Tasks, Keep과 통합되어 정보를 업데이트하고 가져올 수 있습니다.

Circle to Search: AI 기반 수학 문제 해결

Circle to Search 기능은 이제 더 복잡한 수학 및 물리 문제를 해결할 수 있습니다. 사용자가 문제를 동그라미로 표시하면 AI가 이를 분석하고 단계별로 해결 방법을 제시합니다. 이는 학생들이 문제를 직접 풀 수 있도록 안내하여 학습 효과를 높입니다. 예를 들어, 특정 수학 문제를 동그라미로 표시하면, AI가 이를 단계별로 분해하여 풀이 과정을 설명해줍니다.

Google 검색의 AI 개편

Google 검색은 AI Overviews 기능을 도입하여 검색 결과 페이지를 요약된 답변으로 구성합니다. 이 기능은 사용자가 원하는 정보를 더 빠르고 정확하게 찾을 수 있도록 돕습니다. AI Overviews는 검색 결과를 요약하여 사용자가 필요한 정보를 한눈에 볼 수 있게 하며, Perplexity나 Arc와 같은 AI 검색 도구와 유사한 경험을 제공합니다. 이를 통해 사용자들은 보다 효율적으로 정보를 검색하고 활용할 수 있습니다.

Gemini Nano와 기기 내 AI 향상

Gemini Nano는 Gemini AI 모델 중 가장 작은 모델로, Chrome 데스크톱 클라이언트와 Android 기기에 통합될 예정입니다. 이 모델은 소셜 미디어 게시물 작성, 사기 전화 탐지, 동영상 분석 등 다양한 작업을 지원합니다. 예를 들어, 사용자가 특정 동영상을 보고 질문을 던지면 AI가 자동 자막을 기반으로 답변을 제공하거나, 사기 전화의 대화 패턴을 실시간으로 분석하여 경고를 제공합니다.

새로운 AI 칩: TPUv6

구글은 TPUv6, 즉 Trillium을 발표하여 이전 세대 대비 4.7배 성능 향상을 제공하는 차세대 텐서 처리 장치를 선보였습니다. 이 새로운 하드웨어는 초대형 임베딩을 처리하는 데 최적화되어 AI 처리 능력을 크게 향상시킵니다. 이를 통해 더 복잡하고 대규모의 AI 작업을 효율적으로 처리할 수 있습니다.

기타 주요 발표

  • LearnLM: 교육용 AI 모델로, 대화형 튜터링 및 수업 계획 지원. 이 모델은 Google Classroom과 통합되어 교사와 학생들에게 맞춤형 학습 도구를 제공합니다.
  • Google Play: 새로운 앱 검색 기능과 개발자 도구 Engage SDK. 이를 통해 개발자들은 더 개인화된 사용자 경험을 제공할 수 있습니다.
  • Quiz Master: 유튜브 교육 동영상용 AI 생성 퀴즈. 사용자는 동영상을 시청하면서 실시간으로 퀴즈를 풀고 학습을 강화할 수 있습니다.
  • Project IDX: AI 중심의 브라우저 기반 개발 환경으로, 현재 오픈 베타 중. 이 환경은 Google Maps Platform과 통합되어 지리적 기능을 앱에 쉽게 추가할 수 있습니다.


구글 I/O 2024는 AI 기술의 진보를 여러 분야에서 보여주며, 우리의 디지털 생활을 더 직관적이고 효율적으로 만들기 위한 혁신적인 기술들을 선보였습니다. 다만, 어제 발표한 오픈AI의 발표와 비교했을 때 라이브 데모가 부족하고, 발표된 많은 기능들이 즉시 실행되는 것이 아니라 추후에 공개될 예정이라는 점에서 아쉬움을 표하는 사람들도 많았습니다. 이러한 기술의 발전은 향후 우리의 일상생활과 업무 환경을 더욱 편리하고 혁신적으로 변화시킬 것이지만, 당장의 실질적인 적용보다는 미래의 가능성에 더 큰 초점이 맞춰져 있다는 점에서 차이가 있었습니다.

반응형