구글 I/O통해 초거대 언어모델 공개
멀티모달 도입, 이미지로도 AI 검색

1백여 다국어 학습, 번역·추론도 가능
AI챗봇 바드에 한국어 맨 먼저 적용

대중적 의견 알수있는 관점기능 탑재
체류시간 늘려 캐시카우 시장 확보

음유시인이 노래하기 시작했다. 지난 5월 10일 미국 캘리포니아주 마운틴뷰 쇼어라인 엠피시어터에서 열린 구글의 연례개발자회의 ‘구글 I/O(Input/Output)’는 검색 최강자 구글이 검색엔진과 각종 애플리케이션에 생성AI를 본격 서비스하기 시작한 첫날이었다.

사실 구글은 지난 2월 8일 프랑스 파리에서 생성AI 챗봇인 바드를 공개했었다. 바드는 음유시인이라는 의미다. 정작 바드는 시장의 기대를 충족시키지 못했다. 트위터를 통해 공개된 데모에선 바드가 황당한 대답을 하는 장면이 그대로 노출되고 말았다. 구글 주가는 하루만에 8% 넘게 폭락했다.

문제는 기술이 아니었다. 서비스였다. 구글은 누가 뭐라해도 생성AI의 원조 기술 맛집이다. 챗GPT를 개발한 오픈AI 역시 구글에 뿌리를 두고 있다. 오픈AI의 수석과학자인 일리야 수츠케버는 구글 출신이다. 챗GPT가 인터넷의 자연어 텍스트들을 모두 읽고 이해할 수 있었던 것도 구글이 2017년에 발표한 ‘Attention is all you need’라는 논문에 기반해서 트랜스포머라는 기반 모델을 개발했기 때문이었다. 구태여 알파고와 이세돌9단의 대국을 상기하지 않더라도 구글은 자타공인 인공지능 기술 최강자였다.

구글맵, 몰입형으로 업그레이드

그런데도 구글이 생성AI의 주도권을 놓친 건 오픈AI와 마이크로소프트한테 2연타를 얻어맞았기 때문이었다. 오픈AI는 챗GPT로 센세이션을 일으키면서 구글에 앞서 생성AI를 대중화시켰다. 샘 알트만 오픈AI CEO는 일약 생성AI 스타로 부상했다. 지난해 2022년 11월 30일 공개된 챗GPT는 하루 사용자 1000만명을 넘어버렸다.

신기술에 수동적인 일반 소비자들에게도 GPT는 시사상식이 됐을 정도였다. MS는 지난 2월 7일 GPT를 탑재한 새로운 검색엔진 빙을 전광석화처럼 선보였다. 사티아 나델라 MS CEO는 빙을 검색엔진이 아니라 응답엔진이라고 재정의했다.

구글 I/O에서 구글은 생성AI를 자사 25개 서비스에 대대적으로 적용했다. 지메일에 적용된 헬프 미 라이트 기능이 대표적이다. 구글 포토에도 AI 편집 기능이 추가됐다. 구글은 더욱 강화된 구글 포토 매직 에디터 기능을 올해 안에 출시할 것이라고 밝혔다.

구글맵 역시 AI를 통해 몰입형 지도로 업그레이드됐다. 구글엔 20억명 이상이 사용하는 서비스만 6개가 있다. 5억명 이상이 사용하는 서비스는 15개에 달한다. 당연히 구글독스나 구글스프레드시트 같은 업무용 애플리케이션에도 생성AI가 전면적으로 적용됐다. 구글은 버튼 하나면 자사 구글 워크스페이스에 생성AI 기능을 적용할 수 있도록 만들었다.

이제까지 영어로만 사용이 가능했던 구글의 AI챗봇 바드엔 다국어 기능이 추가됐다. 맨 먼저 적용된 언어는 한국어와 일본어다. 구글 I/O에선 한국어로 명령어를 입력해서 특정 프로그램 코딩의 오류를 찾아내는 장면이 시연됐다.

사실 챗GPT가 사용자들을 놀라게 했던 건 일상적인 이메일 작성을 대신해줄 수 있다는 가능성 때문이었다. 대중 소비자한테 생성AI의 기술은 지나치게 어렵거나 복잡할 수밖에 없다. 그렇지만 해당 기능이 구현된 서비스가 일상적으로 편리하다면 열광할 수밖에 없다. 그렇지만 챗GPT 자체가 이메일 서비스는 아니었다. 사용자들은 챗GPT에 원하는 문장을 질문한 다음 그걸 다시 이메일에 복붙하는 방식이었다.

이걸 자체 서비스에 탑재한 건 MS였다. 오픈AI의 투자사인 MS는 챗GPT를 자사의 이메일 서비스인 핫메일에 곧장 적용했다.

그런데 여기서 생성AI의 주도권을 잡은 오픈AI와 MS 동맹의 약점이 드러났다. 오픈AI는 절반만 영리법인이다. 2015년 출범 당시엔 비영리법인이었다. 창업자인 샘 알트만이나 주요 주주인 MS조차도 생성AI로 벌어들이는 수익의 일정 한도 이상은 가져가지 못하도록 돼 있다. 생성AI 개발이 상업적 목적으로 왜곡되지 못하게 만들려는 장치다. 바꿔 말하면 오픈AI는 생성AI의 상업적 서비스에는 관심이 없다. 이걸 서비스화시키려는건 MS다.

MS 검색엔진 시장점유율 3% 남짓

기술과 서비스가 이원화돼 있다는 뜻이다. 그런데 MS의 B2C 서비스 저변은 구글만큼 막강하지 않다. 검색엔진 시장만 놓고 봐도 MS의 검색엔진 빙의 글로벌 시장 점유율은 3% 남짓에 불과하다. 반면에 구글은 92.58%다. MS의 오피스 프로그램 제품군인 오피스365는 분명 경쟁력이 있지만 기술과 서비스의 이원화가 약점이다.

게다가 구글 워크스페이스는 무료인 반면 오피스365는 구독 기반의 유료 서비스다. 유료 서비스에 걸맞는 차별화된 AI 서비스를 제공하지 못하면 마찬가지로 AI를 탑재한 구글과 유리한 경쟁을 벌이기 어렵다는 의미다. 그렇다면 특화된 AI 기술력을 보여줘야 하지만 원천 기술을 가진 오픈AI의 최우선 관심사는 상용화 서비스가 아니라 교육이다. 오픈AI는 칸 아카데미와 듀오링고 등과 함께 무료 AI 교육 서비스에 집중하고 있다. 미국 증시 시총 2위 상장사인 MS와는 입장이 다른 것이다.

의료·보안데이터 집중학습

구글은 이번 구글 I/O에서 차세대 초거대 언어 모델인 팜2를 공개했다. LLM이라고 줄여 부르는 초거대 언어 모델은 현재 생성AI 경쟁의 핵심 기술력이다. 얼마나 큰 빅데이터 세트를 학습했고 얼마나 전문적인 데이터 세트를 습득했는지가 생성AI의 경쟁력이기 때문이다. 이제까지 구글의 초거대 언어 모델 이름은 람다였다. 구글은 2022년 차세대인 팜을 처음 공개했다. 이번에 업그레이드된 팜2는 100개 이상 다국어 텍스트를 학습해서 번역과 코딩은 물론 추론까지 가능하게 발전했다.

특히 구글을 이끄는 순다르 피차이 알파벳 CEO는 “팜2가 과학과 수학 문제에 대한 광범위한 학습을 거쳐서 논리력과 추론 능력을 강화했다”고 강조했다. 기술의 구글답게 생성AI도 과학과 수학에 강하게 키운 셈이다. 거칠게 비유하자면 오픈AI의 챗GPT나 GPT-4가 문과생에 가깝다면 구글의 팜2는 이과생에 가깝다.

실제로 구글은 팜2를 특정 영역에 특화되게 파인튜닝 그러니까 미세 조정한 메드팜2와 시큐러티팜2도 선보였다. 각각 의료 데이터와 보안데이터를 를 집중 학습시켜서 파인튜닝한 생성AI들이다. 역시 거칠게 비유하자면 의대와 공대를 졸업한 인공지능인 셈이다.

팜2는 수학적 추론 성능을 대폭 강화한 덕분에 코딩 성능도 강화됐다. 파이선과 자바스크립트 같은 기본 코딩 언어뿐만 아니라 프롤로그나 포트란과 베릴로그 같은 특수 프로그래밍 언어도 자유자재로 활용한다. 팜2는 팜1보다 파라미터 숫자가 더 크다. 인공신경망의 크기 단위는 파라미터는 한동안은 AI의 성능을 뜻하는 것처럼 받아들여졌다.

최근 들어선 크다고 무조건 좋은 건 아니라는 인식이 AI 업계 안에서도 상식이 됐다. 오픈AI도 최신 모델인 GPT-4에선 파라미터를 밝히지 않았다. 구글 역시 팜2의 파라미터를 비공개로 했다. 그렇지만 팜2가 현존하는 최대 규모 초거대 언어 모델일 가능성이 높다. 이전 모델인 팜의 파라미터는 5400억개였다. 오픈AI의 GPT-3가 1750억개였다. 구글은 팜2로 기술적 우위까지 어느 정도는 증명해낸 셈이다.

사실 구글 AI 전략이 빠르게 서비스 중심으로 확대된 배경엔 구글 내부의 변화도 중요했다. 지난 4월 10일 지난 10년 동안 구글의 AI 개발을 상징했던 제프리 힌튼 캐나다 토론토 대학교 교수가 구글을 떠났다. 제프리 힌튼 교수는 머신러닝과 심층 신경망 분야의 개척자다. 오픈AI의 일리야 수츠케버도 제프리 힌튼 교수의 직계 제자다. 교수 신분으로 창업한 AI기업인 DNN리서치가 2013년 구글에 인수되면서 구글러가 됐다. 구글의 AI연구조직 구글브레인을 이끌어어왔다.

그렇지만 제프리 힌튼 교수는 구글을 떠나면서 가진 뉴욕타임스와의 인터뷰를 통해 “빅테크 기업들이 멈출 수 없는 경쟁에 뛰어들고 있다”고 우려했다. 제프리 힌튼 교수는 “악의적 의도를 가진 사람이 AI 기술을 나쁜 일에 사용하는 것을 막기가 쉽지 않을 것으로 보인다”며 “핵무기와 달리 기업이나 국가가 비밀리에 AI 기술을 연구하고 있는지 알 방법이 없다”고 지적했다.

제프리 힌튼 교수는 구글이 AI가 인류에 해를 끼치지 않도록 하는 적절한 관리자 역할을 해야 한다고 주장해왔다. 미성숙한 AI가 인류에 득보단 해가 될 수 있다는 우려 때문이었다. 역설적으로 구글이 기술적으론 앞섰지만 대중화와 상용화에서 오픈AI와 MS한테 밀리게 된 단초가 됐다. 제프리 힌튼 교수가 떠나면서 사실상 구글의 AI 주도권은 아카데미에서 비즈니스맨한테로 넘어가게 됐다. 이번 구글I/O의 AI 서비스 퍼스트가 그 시작이다.

특히 구글은 AI 챗봇 바드를 이용해서 검색 이후 관련 정보에 관한 대중적 의견을 알 수 있는 관점 기능을 추가했다. 이제까지 구글 검색 엔진은 머무는 곳이 아니라 거쳐 가는 지점이었다. 구글 검색 엔진으로 원하는 웹사이트를 찾아낸 다음 빠르게 해당 아웃링크로 이동하는 게 주요 목적이었다.

생성AI, 보고 듣는 경쟁 점입가경

구글은 교차로였지 광장이 아니었다. 관점 탭을 추가하면서 사용자들은 구글을 통해 사실만이 아니라 의견까지 알 수 있게 됐다. 블로그 글이나 유튜브 영상을 추천해줘서 객관적 정보와 주관적 의견을 결합한 것이다.

이건 구글 사용 패턴을 변화시킬 수도 있다. 일단 바드로 채팅을 하거나 관점으로 의견을 물으면 구글에 머무는 체류 시간이 길어진다. 체류 시간이 길어지면 광고주들에 광고를 할 수 있는 여지가 늘어난다.

이건 구글이 생성AI를 검색 도입에 주저하게 만들었던 검색 광고 카니발라이제이션의 해결책이 될 수 있다. 검색어 중심 검색 시장이 채팅과 응답 중심으로 바뀌면 구글의 캐시카우인 검색 광고 시장이 타격을 받을 수 있다는 우려가 있었다. 구글은 체류 시간을 늘려서 변화하는 검색 환경에서도 이익률을 극대화시켜나갈 가능성이 높다.

동시에 구글은 구글렌즈를 통해 텍스트 만이 아니라 이미지로도 AI검색이 가능한 멀티모달 기능을 도입했다. 이 밖에도 MS의 협업 코딩 애플리케이션인 코파일럿의 대항마로 듀엣AI를 공개했고 AI음원생성기인 뮤지ML도 대중 공개했다. 앞으로 생성AI 경쟁이 읽고 쓰는 경쟁에서 보고 듣는 경쟁으로 확대될 것이라는 의미다. 음유시인의 노래소리가 커졌다. 구글이 AI링에 제대로 뛰어들었다.

- 신기주 더 밀크 코리아 부대표

저작권자 © 중소기업뉴스 무단전재 및 재배포 금지