[전자신문] 네이버가 만드는 '서치 GPT', 챗GPT와 차이점 뭘까
최고관리자
2023-02-06 08:54
8,547
-
20237회 연결
본문
네이버(NAVER)가 지난 4일 실적발표에서 상반기 내 '서치 GPT'를 선보이겠다고 발표함에따라 관심이 모아지고 있다. 언뜻 최근 이슈인 오픈AI의 챗GPT 열풍에 편승하는 것으로 보이나, 실상 네이버는 지난해 9월부터 이를 준비해왔다. 네이버의 초거대 AI 모델 '하이퍼클로바'를 적용한 AI 검색 개선 프로젝트 일명 '오로라 프로젝트'다. 네이버가 국내 최대 한글 데이터베이스를 보유하고 AI기술력도 앞선다는 평가를 받는다는 점에서 챗GPT 등 다른 생성AI와의 차이점과 경쟁력도 주목된다.
초거대 AI 언어모델 적용한 네이버 '오로라 프로젝트'…서치 GPT 밑작업
오로라(Aurora) 프로젝트는 'AI 기반 강력한 범용 관련도 순위 매기기 및 응답'의 약자다. AI 기술로 검색 기술을 고도화한다는 의미다. 최근 몇 년새 포털 사용자들은 특정 키워드를 넘어 문장처럼 복잡한 형태의 검색어를 입력해 최적의 결과를 얻으려한다. 이를 충족시킨 게 바로 챗GPT다. 네이버는 이처럼 변화한 사용자 패턴에 맞춰 적합한 정보를 찾아주는 알고리즘을 적용했다. 오픈 AI가 자사 초거대 AI 모델 GPT-3.5를 챗GPT에 적용했듯, 네이버도 포털 검색에 자사 초거대 AI 모델 하이퍼클로바를 적용한 것이다.
오로라 프로젝트는 △뉴럴 매칭 △지식스니펫 △동일 출처 검색결과 묶음 등 기술을 적용한다. 뉴럴 매칭은 검색어와 디지털 문서의 서로 다른 표현을 연결하는 기술이다. 기존에는 검색어와 동일한 단어가 들어간 결과만 확인할 수 있었다면, 뉴럴 매칭을 통해 유의어나 동의어 검색 결과도 함께 확인할 수 있다.
이렇게 얻은 다양한 정보를 한눈에 보기 쉽게 정리하는 것이 지식스니펫이다. 사용자가 검색 결과에서 원하는 정보를 쉽게 확인하도록 리스트형·테이블형·카드형·답변 강조형 등 가독성 높은 형태로 제공한다. 하나의 웹 문서가 아닌 여러 웹문서로부터 추출된 다양한 결과를 함께 보여주기도 한다. 일반백과와 어린이백과 등 서로 다른 출처에서 사용자의 연령에 맞는 결과를 뽑아주기도 한다. 추가로 얻을 수 있는 정보까지 제공하는게 '동일출처 검색결과 묶음' 기술이다.
검색 패러다임 '챗봇' 형태로 바뀔 것
오로라 프로젝트를 고도화해 실제 서비스로 구현하는 게 서치GPT다. 다만 챗GPT와 같은 챗봇 형태가 아닌, 검색 결과를 고도화하는 형태로 추정된다. 마이크로소프트(MS)가 자사 검색 엔진 '빙(Bing)'에 챗GPT 기능을 적용한 것과 유사할 전망이다. 구글과 바이두 역시 AI 챗봇 기술을 검색엔진과 통합할 계획이다. 오로라 프로젝트의 뉴럴 매칭처럼 검색어의 의도를 해석하고, 지식스니펫처럼 관련성 높은 정보를 텍스트·이미지·동영상·통계·링크 등으로 제공하는 것이다. 구글은 이미 검색창에 이같은 AI 기술을 일부 적용했고, 챗GPT 같은 챗봇에 네이버 지식스니펫처럼 출처를 명기할 수 있는 서비스 '스패로우'를 수주 내 공개할 계획이다.
........
초거대 AI 언어모델 적용한 네이버 '오로라 프로젝트'…서치 GPT 밑작업
오로라(Aurora) 프로젝트는 'AI 기반 강력한 범용 관련도 순위 매기기 및 응답'의 약자다. AI 기술로 검색 기술을 고도화한다는 의미다. 최근 몇 년새 포털 사용자들은 특정 키워드를 넘어 문장처럼 복잡한 형태의 검색어를 입력해 최적의 결과를 얻으려한다. 이를 충족시킨 게 바로 챗GPT다. 네이버는 이처럼 변화한 사용자 패턴에 맞춰 적합한 정보를 찾아주는 알고리즘을 적용했다. 오픈 AI가 자사 초거대 AI 모델 GPT-3.5를 챗GPT에 적용했듯, 네이버도 포털 검색에 자사 초거대 AI 모델 하이퍼클로바를 적용한 것이다.
오로라 프로젝트는 △뉴럴 매칭 △지식스니펫 △동일 출처 검색결과 묶음 등 기술을 적용한다. 뉴럴 매칭은 검색어와 디지털 문서의 서로 다른 표현을 연결하는 기술이다. 기존에는 검색어와 동일한 단어가 들어간 결과만 확인할 수 있었다면, 뉴럴 매칭을 통해 유의어나 동의어 검색 결과도 함께 확인할 수 있다.
이렇게 얻은 다양한 정보를 한눈에 보기 쉽게 정리하는 것이 지식스니펫이다. 사용자가 검색 결과에서 원하는 정보를 쉽게 확인하도록 리스트형·테이블형·카드형·답변 강조형 등 가독성 높은 형태로 제공한다. 하나의 웹 문서가 아닌 여러 웹문서로부터 추출된 다양한 결과를 함께 보여주기도 한다. 일반백과와 어린이백과 등 서로 다른 출처에서 사용자의 연령에 맞는 결과를 뽑아주기도 한다. 추가로 얻을 수 있는 정보까지 제공하는게 '동일출처 검색결과 묶음' 기술이다.
검색 패러다임 '챗봇' 형태로 바뀔 것
오로라 프로젝트를 고도화해 실제 서비스로 구현하는 게 서치GPT다. 다만 챗GPT와 같은 챗봇 형태가 아닌, 검색 결과를 고도화하는 형태로 추정된다. 마이크로소프트(MS)가 자사 검색 엔진 '빙(Bing)'에 챗GPT 기능을 적용한 것과 유사할 전망이다. 구글과 바이두 역시 AI 챗봇 기술을 검색엔진과 통합할 계획이다. 오로라 프로젝트의 뉴럴 매칭처럼 검색어의 의도를 해석하고, 지식스니펫처럼 관련성 높은 정보를 텍스트·이미지·동영상·통계·링크 등으로 제공하는 것이다. 구글은 이미 검색창에 이같은 AI 기술을 일부 적용했고, 챗GPT 같은 챗봇에 네이버 지식스니펫처럼 출처를 명기할 수 있는 서비스 '스패로우'를 수주 내 공개할 계획이다.
........