본문 바로가기
뉴스

[테크] Google Gemini AI

by 멋진 개구리 2023. 12. 14.
반응형

Gemini AI.
(10) Hands-on with Gemini: Interacting with multimodal AI - YouTube

  1. Gemini 테스트 및 상호작용 예시:
    • Gemini 모델은 이미지 기반으로 추론을 수행하는 멀티모달 AI 모델이다.
    • 사용자가 영상을 통해 모델과 상호작용하는 테스트를 진행하였다.
    • Gemini는 이미지에서 물체를 추론하고 사용자의 상호작용에 응답한다.
  2. 이미지 인식 및 설명:
    • 모델은 주어진 이미지에서 테이블 위에 있는 종이와 윤곽선을 감지하고 설명한다.
    • 사용자가 추가적인 요소를 제시하면, 모델은 그에 대한 추론을 수행하여 결과를 제시한다.
    • 예를 들어, 파란색 오리에 대한 설명 및 특징을 제시하고 상호작용을 통해 사용자와 소통한다.
  3. 게임 제안과 언어 발음 안내:
    • 모델은 게임 "국가 맞히기"를 제안하고 사용자와 협력하여 게임을 진행한다.
    • 표준 중국어 발음과 관련된 정보를 제공하며, 게임에서 정확한 답을 유도한다.
  4. 예술 및 창의성 활용:
    • 사용자는 모델을 통해 예술적인 창작물을 만들어본다.
    • 모델은 그림에 대한 설명 및 피드백을 제공하며, 다양한 창의적 활용을 유도한다.
  5. 상황 분석 및 결정:
    • 모델은 주어진 상황에서 오리의 이동 방향을 선택하는 결정을 돕는다.
    • 사용자는 모델과 상호작용하여 상황을 분석하고 최적의 선택을 한다.
  6. 과학적 지식 및 퀴즈:
    • 모델은 과학적인 주제에 대한 퀴즈를 제공하고 사용자와 상호작용하여 해답을 도출한다.
    • 별자리, 행성 순서 등에 대한 정보를 공유하고 퀴즈를 통해 학습을 유도한다.
  7. 영화 및 게임 장면 재현:
    • 모델은 유명한 매트릭스 영화 장면과 고양이의 도약 장면을 상상하고 재현한다.
    • 사용자는 상상된 상황에 대한 모델의 예측을 확인하고 상호작용한다.
  8. 기술적인 프롬프트 활용:
    • 모델은 프롬프트를 통해 사용자의 창의력을 도전하고 예술, 과학, 게임 등 다양한 주제에서 모델의 능력을 확인한다.

 

반응형

댓글