OpenAI의 ChatGPT는 AI 도구 분야에서 유명해졌지만 Google은 방관하지 않습니다. 빛나는 새로운 Gemini 브랜드와 Gemini Advanced 서비스를 통해 Google은 OpenAI의 주력 제품에 대한 강력한 경쟁자를 출시했습니다.
Google은 Gemini Advanced(이전 Bard 챗봇의 발전 버전)가 GPT-4를 능가한다고 주장합니다. 하지만 과연 그럴까요? 한 달에 20달러만 남는다면 어떤 유료 멀티모달 AI 도구를 사용해야 할까요?
이 문제를 해결해 보겠습니다. 여기에는 명확한 “최고”가 없습니다. 이러한 챗봇을 차별화하는 것은 반드시 객관적으로 “더 스마트하다”는 것이 아니라 어떤 기능, 틈새 기능 및 외부 통합이 기존 도구 및 작업 흐름에 가장 잘 맞는지에 달려 있습니다.
이러한 강력한 도구 중 하나가 한 달에 20달러의 가치가 있는지 여부는 전적으로 귀하가 이미 사용하고 있는 도구와 도움이 필요한 작업에 달려 있으며, 우리는 핵심 세부 사항을 결정하는 데 도움을 드리고 있습니다.
이미지 생성: 사실성 대 유연성
Gemini와 ChatGPT Plus는 모두 귀하의 말을 시각적 표현으로 변환할 수 있습니다. Stable Diffusion 및 기타 이미지 생성기와 달리 이 두 가지는 자연어 프롬프트를 이해합니다. Gemini의 현재 초점은 사실성을 달성하는 것입니다. 그러나 베타 버전에서도 우리의 마음을 사로잡았고 결국 Gemini Advanced에 구현될 수 있는 Google의 별도 ImageFX 모델에는 미치지 못합니다. 하지만 이 두 가지는 정사각형 1024×1024 이미지만 생성할 수 있습니다.
OpenAI의 Dall-E 3는 유연성을 높이기 위해 사실성을 포기합니다. 이미지 크기(정사각형, 세로, 16:9 등)를 지정할 수 있습니다. 이는 특정 웹 사이트나 디자인에 맞게 조정된 시각적 요소가 필요하고 수동 자르기를 건너뛰려는 경우 유용합니다. 하지만 Dall-E 이미지를 몇 마일 떨어진 곳에서도 쉽게 알아볼 수 있게 만드는 독특한 만화 스타일이 있습니다.
둘 중 하나를 선택하는 것은 목표에 따라 다릅니다. 온라인 상점에서 거의 완벽한 제품 사진을 찍으려면 Adobe 또는 Corel에서 제공하는 것과 같은 특수 도구가 필요할 수 있습니다. 그러나 기발한 일러스트레이션이나 재미있는 브레인스토밍 영상의 경우 이러한 경쟁자 중 하나라도 충분할 수 있으며 스타일에 대한 개인적인 선호도에 따라 여지가 남습니다.
음성 편의성: 집에서 vs. 이동 중에
때로는 멀티태스킹을 허용하거나 단순히 화면을 쳐다보는 데 휴식을 주기 위해 AI의 응답을 듣고 싶을 때가 있습니다. Google 생태계와의 연결 덕분에 Gemini는 원활한 소리내어 읽기 기능을 제공합니다. 그러나 ChatGPT Plus에는 고유한 장점이 있습니다. 기본 모바일 앱을 사용하면 실제로 어디에서나 대화를 할 수 있습니다. 일반적으로 OpenAI의 목소리는 좀 더 인간적인 느낌이 들지만 스마트폰을 통해서만 가능합니다.
선택은 작업 방식에 따라 결정됩니다. AI 사용이 주로 다른 Google 도구와의 통합이 편리한 책상에서 이루어지면 Gemini가 승리합니다. 하지만 끊임없이 이동하는 사람들의 경우 주머니에 휴대폰을 넣고 채팅 내용을 내레이션으로 들으면 ChatGPT Plus를 선택하게 될 수도 있습니다. 시각 장애가 있는 사람들에게는 이것이 중요해 보일 수 있지만 많은 사람들은 재생되는 다른 텍스트 음성 변환(TTS) 방법을 선호합니다. “자연스러운 목소리”의 케이던스가 너무 느리기 때문에 매우 빠른 속도로 콘텐츠를 재생합니다. 그런 경우에는 두 사이트 모두 TTS와 호환되므로 세척이 가능합니다.
속도가 필요함
말하자면 후드 아래를 들여다 보겠습니다. 이들의 “두뇌 능력”(토큰 컨텍스트)은 비슷해 보이지만 속도에는 큰 차이가 있습니다. Gemini Ultra는 GPT-4(또는 Anthropic의 Claude AI)와 비교할 때 매우 빠릅니다. Gemini Ultra를 사용하면 GPT-3.5 속도로 GPT-4 품질 출력을 얻을 수 있습니다.
예를 들어: 암호 해독 “시간을 내어 암호화폐가 경제 거래의 미래를 형성하는 데 중요한 역할을 할 수 있는 이유에 대한 에세이를 작성해 주십시오.”라는 메시지를 사용했습니다. Gemini Advanced는 전체 에세이를 작성하는 데 12.14초가 걸렸지만 GPT-4는 거의 1분(정확히 말하면 53.13초)이 걸렸습니다. OpenAI 챗봇의 이전 버전인 GPT-3.5 Turbo는 에세이를 작성하는 데 11.06이 걸렸습니다.
개인 정보 보호 문제
AI에 대한 가장 큰 우려 사항 중 하나는 개인 정보 보호입니다. 즉, 귀하가 제공하는 프롬프트 및 기타 정보가 전송, 보관 및 액세스되는 곳입니다. ChatGPT는 응답을 개선하기 위해 30일 동안 채팅을 유지하지만 개인 정보 보호를 중요시하는 사람들은 주의할 수 있습니다. 반면에 Google은 무려 18개월 동안 귀하의 정보를 저장합니다.
두 서비스 모두 서로 다른 개인 정보 보호 문제를 제기하므로 기능만큼 데이터에 대한 감정에 따라 선택하게 됩니다. 다행스럽게도 둘 다 채팅을 삭제하는 옵션과 공유하는 옵션도 있습니다.
ChatGPT의 틈새시장 승리: PDF 분석
PDF를 사용하고 숨쉬는 경우 이 콘테스트는 분명합니다. ChatGPT Plus는 해당 문서를 조사하여 통찰력을 추출하고 문서에 대한 질문에 답하며 일반적으로 시간을 절약할 수 있습니다. 아마도 법적 또는 기술적 이유로 인해 Google은 이러한 기능을 Gemini에 통합하지 않았습니다. PDF가 복사하여 붙여넣기만 하면 되는 짧은 텍스트 덩어리인 경우에는 문제가 되지 않을 수 있습니다. 그러나 고객의 서류 작업, 테이블 또는 연구 조사를 저글링하는 사람들에게는 거래가 중단될 수 있습니다.
이것이 Gemini에게 영구적인 장애가 될 필요는 없지만 현재로서는 PDF를 많이 사용하는 사람들이 ChatGPT의 향상된 기능을 선택해야 할 강력한 이유가 있습니다. 또한 Claude AI는 무료로 PDF를 분석할 수 있으며 해당 모델은 GPT-4만큼 훌륭하고 정확합니다.
검색 전쟁
챗봇 세션에 포함된 검색 결과의 품질이 중요하다면 Google에 대한 Gemini의 기본 링크가 가장 중요합니다.
Gemini Advanced를 사용하면 이동 중에도 Google 검색에서 데이터를 가져오는 모델을 통해 사용자가 실시간 응답을 얻을 수 있습니다. 또 다른 매우 유용한 기능은 Gemini Advanced에 사람들이 Google 검색을 사용하여 상호 작용의 모든 사실을 다시 확인할 수 있는 버튼이 있다는 것입니다. 이는 간헐적인 환각의 영향을 최소화하고 소스 스크래핑 및 사실 확인에 도움이 됩니다.
ChatGPT는 Bing에 의존하고 있는데, Bing은 개선되기는 하지만 실제로 Google의 지배력과 경쟁할 수는 없습니다.
챗봇이 제공하는 모든 답변에는 환각이 포함되기 쉽다는 점에 유의하는 것이 중요합니다. 이것이 바로 생성 AI의 특성입니다. 모델이 환각을 느낄 수 없다면 기본적으로 이미 존재하는 정보를 재현하게 됩니다. AI 모델과 상호작용할 때 사실 확인은 매우 중요합니다.
ChatGPT Plus에는 있지만 Gemini Advanced에는 없는 것
개방형 생태계 및 타사 통합: ChatGPT Plus는 플러그인과 사용자 생성 GPT 등 타사 앱과 통합되어 차별화됩니다. 이를 통해 사용자는 AI 비서와 직접 상호 작용하는 플러그인을 추가하여 작업 흐름을 간소화하고 특수 기능을 잠금 해제할 수 있는 무한한 가능성을 창출합니다. Canva 또는 Zapier로 작업하고 워크플로에서 ChatGPT와 통합하는 데 익숙하다면 Google Gemini로 전환하는 것이 다운그레이드처럼 느껴질 것입니다.
개인화되고 수익성 있는 대화: GPT 스토어는 창작자에게 보상을 제공하고 ChatGPT 생태계 내에서 지속적인 혁신과 성장을 약속하는 것을 목표로 합니다. 개인화된 챗봇을 만들어 돈을 벌고 싶거나 챗봇이 특정 주제에 대해 더 많이 알고 특정 스타일을 채택하며 다른 어떤 옵션보다 더 개인화될 수 있도록 GPT와 특별히 맞춤화된 대화를 시도하고 싶다면… 그렇지 않으면 ChatGPT Plus 비용을 지불하세요.
효율성을 위한 대화 중간 편집: ChatGPT Plus를 사용하면 여러 부분으로 구성된 대화에서도 이전 프롬프트를 조정할 수 있습니다. 예를 들어 6개의 명령과 6개의 응답이 포함된 6샷 상호작용을 상상해 보세요. ChatGPT에서 사용자는 네 번째 명령을 편집할 수 있으며 ChatGPT는 해당 상호 작용 전의 모든 컨텍스트만 고려하여 새로운 답변을 생성합니다. 이렇게 하면 많은 노력을 절약하고 세션을 더욱 효율적으로 만들 수 있습니다. Google에서는 사용자가 이전 명령에서 실수를 했다는 것을 알게 되면 새 세션을 시작해야 했습니다.
ChatGPT Plus의 이 기능은 귀중한 토큰을 절약하고 전체 세션이 다시 시작되는 것을 방지하여 상호 작용을 최적화하고 창의적인 흐름을 유지합니다.
ChatGPT Plus에는 없는 Gemini Advanced 가스
번들로 제공되는 클라우드 스토리지 및 추가 기능: 포함된 2TB Google One 구독은 이미 Google 생태계에 참여하고 있는 사용자에게 상당한 비용 절감 효과를 제공합니다. 비슷한 요금제는 iCloud에서 월 10달러, Dropbox에서 12달러 정도입니다. 이러한 사용자의 경우 Gemini Advanced로 전환하면 클라우드 서비스와 함께 ChatGPT Plus를 사용할 경우 사용자가 지불하는 20달러 대신 최상위 AI 챗봇의 경우 평균 10달러만 추가되므로 비용을 효과적으로 절감할 수 있습니다.
정확성을 위해 Google에서 제공: Gemini Advanced는 Google 검색의 방대한 지식에 대한 응답을 실시간으로 확인합니다. 이는 Google의 신뢰성과 관련성을 바탕으로 정확한 최신 정보를 손쉽게 이용할 수 있음을 의미합니다. Bing을 사용한 ChatGPT는 정확하지 않습니다.
즉각적인 초안 및 스타일 개선: Gemini Advanced를 사용하면 버튼 클릭만으로 응답 스타일(정식, 캐주얼, 정교한)을 맞춤 설정할 수 있습니다. 추가 프롬프트가 필요하지 않습니다! 작업을 개선하기 위해 Gemini는 다양한 표현이나 초점이 포함된 여러 초안을 제공하므로 결과를 빠르게 비교하고 개선할 수 있습니다.
AI 놀이터로서의 Google Apps: Gemini Advanced의 직접 통합을 통해 Google Docs에 뛰어들고, 여행을 계획하고, YouTube를 조작하고, 콘텐츠를 편집하고, 공동작업할 수 있습니다. 또한 Google 포토에서 제공하는 새롭고 강력한 사진 편집 도구(AI, 위장, 조명 도구, HDR 향상 등을 사용하여 개체를 삭제하는 매직 지우개)는 AI가 이미지 매개변수를 조정하는 데 도움이 될 때 더욱 강력해집니다.
평결 … 일종의
이미 ChatGPT Plus 비용을 지불하고 해당 기능을 자주 사용하는 경우 Gemini는 월 20달러를 추가로 정당화할 만큼 사용 사례에 충분한 참신함을 제공하지 못할 수 있습니다. 마찬가지로 귀하의 요구 사항이 상당히 적다면(작문 지원, 창의적인 브레인스토밍) 이러한 서비스 중 하나가 적합할 것입니다.
그러나 둘 중 하나에 대한 비용을 지불하기 시작하려는 경우 해당 추가 항목이 결정 요인이 될 것입니다. 2TB의 클라우드 스토리지, 검색 정확성, Google 제품군 – 이러한 것들이 당신을 한 쪽으로 확고히 기울게 합니까, 아니면 OpenAI의 타사 앱 통합에 대한 약속으로 인해 실험하고 싶습니까? AI에 관해서는 “상황에 따라 다르다”가 정직한 대답으로 남아 있기 때문에 선택은 정말로 당신에게 달려 있습니다.
편집자: Ryan Ozawa.