[전자신문] 사람 같은 AI 만드는 '자연어처리' 기술…어떤 스타트업이 이끄나 [긱스]
최고관리자
2022-10-25 09:33
9,013
-
20613회 연결
본문
국내에서 인공지능(AI)이 본격적으로 주목받기 시작한 것은 2016년입니다. 구글의 AI 전문 계열사 딥마인드의 바둑 AI인 알파고와 한국의 이세돌 기사 간 경기를 온 국민이 지켜봤죠. AI가 공상과학(SF) 영화 속에만 가능한 것이 아니란 것을 확인했습니다. 사람들이 AI를 직접 경험한 것은 이듬해부터입니다. SK텔레콤, KT, 네이버, 카카오 등이 잇따라 AI 스피커를 내놨죠. 사람의 말을 알아듣고 적절하게 대응하는 기기입니다. 이런 AI 스피커의 핵심 기술은 자연어처리(NLP)라고 합니다. 관련 기술의 마지막 단계는 영화 ‘그녀’에서 사만다일 겁니다. 사만다는 연인처럼 주인공의 공허한 삶을 채워주는 인간보다 인간 같은 AI입니다. 한경 긱스(Geeks)가 최근 급격히 커지는 NLP 시장을 한국 스타트업 중심으로 소개합니다.
흔한 것 같지만 높은 기술 수준이 필요한 AI 기술
최근 인공지능(AI) 분야에서 자연어처리(NLP) 관련 시장이 급격히 커지고 있다. AI 스피커, 챗봇 서비스, 전화 상담 등 다양한 곳에서 NLP 기술을 활용하고 있다. 관련 기술과 시장을 국내 유망 AI 스타트업이 혁신하고 있다는 평가다.
NLP는 컴퓨터와 사람의 언어 사이의 상호 작용에 대해 연구하는 AI의 주요 분야 중 하나다. 머신러닝을 통해 인간의 언어를 공부한 AI가 사람의 말이나 문자를 이해하고 다양한 업무를 처리한다. 학계에서 과학자들이 연구하던 NLP가 세상에 알려지기 시작한 것은 AI 스피커가 나오면서다. AI 스피커는 ‘오늘의 날씨는 어때?’, ‘신나는 음악 들려줘’ 등의 이용자의 말에 관련 정보나 서비스를 제공한다.
맞춤법 검사 서비스도 NLP를 활용하는 대표적인 사례다. 사용자가 입력한 문장과 사전 정보를 대조해 어떤 단어의 표현이 잘못됐는지, 올바른 언어 사용법 등은 무엇인지 알려준다. 최근 많은 기업이 소비자의 제품에 대한 평가를 확인하기 이용하는 소셜네트워크(SNS)의 게시물 분석에도 NLP가 동원된다. 글로벌 통계 플랫폼 스태티스타(Statista)에 따르면 글로벌 NLP 관련 시장은 지난해 175억달러(약 25조 1090억원)에서 오는 2025년 433억달러(62조 1138억원)로 급격히 커질 전망이다.
높은 수준의 기술력이 필수인 NLP 산업에서 한국 스타트업이 주목받고 있다. 튜닙은 NLP, 초대규모 AI 등 고난도 AI 기술을 자체 개발하는 업체다. 카카오의 AI 전문 자회사 카카오브레인 출신의 NLP 엔지니어들이 주축으로 지난해 3월에 설립했다. 튜닙은 지난달 열린 글로벌 스타트업 축제 ‘스플래쉬 2022’에서 대상도 받았다. 앞서 튜닙은 ‘2022 인공지능 온라인 경진대회’에서도 과학기술정보통신부 장관상을 받기도 했다. 튜닙은 올해 들어 AI 기반 챗봇 서비스를 잇따라 내놨다. 지난 8월에 내놓은 여행 챗봇 ‘블루니’는 세계 어디든 다닐 수 있는 캐릭터다. AI 연구단체 오픈AI의 언어모델인 ‘GPT-3’에 기반으로 개발한 영어 챗봇이다. 해외 명소 등 여행을 주제로 한 가벼운 대화부터 깊이 있는 정보도 제공한다.
지난 5일에는 반려견 캐릭터 챗봇 코코와 마스의 시험 버전을 출시했다. 코코와 마스는 각각 다른 성격을 가진 강아지 캐릭터의 AI 챗봇이다. 이용자와 정서적 교감이 가능한 것이 특징으로 간식 주기, 산책하기 등 실제 반려견 같은 활동과 N행시 등 여러 게임을 함께할 수 있다. 문자의 이해를 넘어 사람과 정서적인 교감이 가능하도록 튜닙의 자체 개발한 언어모델로 1.2TB(테라바이트)에 달하는 양의 한국어 데이터를 학습시켰다. 코코와 마스는 카카오톡 채널에서 ‘DearMate 코코’, ‘DearMate 마스’를 친구로 추가하면 누구든지 이용 가능하다.
다양한 분야에서 쓰이는 NLP
구글코리아 연구개발(R&D) 총괄사장을 역임한 조원규 대표가 설립한 스켈터랩스도 챗봇을 앞세워 AI 서비스를 확대하고 있다. 스켈터랩스의 ‘AIQ(AI with Quality) 챗봇’은 높은 ‘의도 파악률’이 강점인 대화형 AI 솔루션이라고 회사 측은 설명했다. AIQ 챗봇은 스켈터랩스의 챗봇 기획 전문가가 고객사의 요구 사항과 관련 데이터를 기반으로 맞춤형 챗봇 시나리오를 직접 기획하는 방식으로 만든다. AIQ 챗봇의 지원 영역으로는 고객 문의 응대, 예약, 조회, 변경 사항 확인, 제품 소개 등이다. 롯데홈쇼핑, 퍼시스, 위대한상상(요기요) 등이 AIQ 챗봇을 사용하고 있다. 조 대표는 “고비용과 인력난 문제로 챗봇 도입을 망설이는 중소규모 사업자들의 디지털 전환을 돕기 위해 AIQ 챗봇의 공급 범위를 확대하고 있다”고 말했다.
글로벌 시장조사업체 CB인사이트가 매년 선정한 글로벌 ‘100대 AI 스타트업’에 올해 한국 기업으로 유일하게 이름을 올린 트웰브랩스도 NLP 업체다. 첨단 NLP와 컴퓨터 비전을 융합해 영상에서 원하는 장면을 찾는 기술을 개발했다. 이용자가 기억 나는 영화의 대사나 상황 묘사 등을 입력하면 해당 장면을 찾아낸다. 예를 들어 ‘아부지 뭐하시노’라고 치면 영화 ‘친구’의 교실 장면이 뜨는 식이다. 트웰브랩스은 기술력을 인정받아 지난 3월 시드(회사 설립 단계 투자)로 60억원을 유치했다. AI 분야의 세계적인 석학 페이페이 리 미국 스탠퍼드대 교수도 투자해 화제를 모았다.
NLP 스타트업 액션파워는 사람의 음성을 글자로 변화하는 서비스 다글로를 운영하고 있다. 지난 2017년에 나온 다글로는 자체 개발한 엔드투엔드(E2E) 음성인식 엔진을 채용해 정확도가 95% 정도라고 회사 측은 설명했다. 지원하는 언어는 한국어, 영어, 일본어, 중국어, 베트남어 등 총 14개다.
AI스타트업도 액션파워와 비슷한 서비스를 제공하고 있다. 리턴제로는 일명 ‘AI 전화’ 앱 비토는 통화 음성 내용을 글자로 바꿔주는 서비스다. 지난 7월에 나온 ‘비토 스피치’는 누구나 음성인식 문자변환 기술을 사용할 수 있는 오픈 API(응용프로그램 인터페이스) 솔루션이다. 리턴제로는 비토로 확보한 음성 데이터로 음성인식 정확도를 높인 AI 모델을 비토 스피치에 적용했다. 비토 관계자는 “비토의 핵심 기술인 소머즈 엔진은 한국어 특성상 정확히 인식하기 어려운 구어체와 자유 발화 등에 특화돼 소음에 노출된 통화 환경에서도 빠르고 정확한 텍스트 변환 기술을 보여준다”고 설명했다.
네이버와 카카오도 NLP 시장에서 경쟁
국내 정보기술(IT) 대기업들도 NLP 기술과 관련 서비스 개발에 회사 역량을 집중하고 있다. 이들은 NLP의 바탕인 일명 ‘초(超)대규모 AI’ 개발을 주도하고 있다. 네이버는 초거대 AI인 하이퍼클로바’를 지난해 처음 공개했다. AI 모델의 크기와 성능을 보여주는 매개 변수(파라미터)가 하이퍼클로바는 2040억 개다. 일론 머스크가 설립한 AI연구소 오픈AI의 ‘GPT-3(1750억 개)’를 넘어서는 수준이다. 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습했다는 것이 네이버 측 설명이다.
..........
흔한 것 같지만 높은 기술 수준이 필요한 AI 기술
최근 인공지능(AI) 분야에서 자연어처리(NLP) 관련 시장이 급격히 커지고 있다. AI 스피커, 챗봇 서비스, 전화 상담 등 다양한 곳에서 NLP 기술을 활용하고 있다. 관련 기술과 시장을 국내 유망 AI 스타트업이 혁신하고 있다는 평가다.
NLP는 컴퓨터와 사람의 언어 사이의 상호 작용에 대해 연구하는 AI의 주요 분야 중 하나다. 머신러닝을 통해 인간의 언어를 공부한 AI가 사람의 말이나 문자를 이해하고 다양한 업무를 처리한다. 학계에서 과학자들이 연구하던 NLP가 세상에 알려지기 시작한 것은 AI 스피커가 나오면서다. AI 스피커는 ‘오늘의 날씨는 어때?’, ‘신나는 음악 들려줘’ 등의 이용자의 말에 관련 정보나 서비스를 제공한다.
맞춤법 검사 서비스도 NLP를 활용하는 대표적인 사례다. 사용자가 입력한 문장과 사전 정보를 대조해 어떤 단어의 표현이 잘못됐는지, 올바른 언어 사용법 등은 무엇인지 알려준다. 최근 많은 기업이 소비자의 제품에 대한 평가를 확인하기 이용하는 소셜네트워크(SNS)의 게시물 분석에도 NLP가 동원된다. 글로벌 통계 플랫폼 스태티스타(Statista)에 따르면 글로벌 NLP 관련 시장은 지난해 175억달러(약 25조 1090억원)에서 오는 2025년 433억달러(62조 1138억원)로 급격히 커질 전망이다.
높은 수준의 기술력이 필수인 NLP 산업에서 한국 스타트업이 주목받고 있다. 튜닙은 NLP, 초대규모 AI 등 고난도 AI 기술을 자체 개발하는 업체다. 카카오의 AI 전문 자회사 카카오브레인 출신의 NLP 엔지니어들이 주축으로 지난해 3월에 설립했다. 튜닙은 지난달 열린 글로벌 스타트업 축제 ‘스플래쉬 2022’에서 대상도 받았다. 앞서 튜닙은 ‘2022 인공지능 온라인 경진대회’에서도 과학기술정보통신부 장관상을 받기도 했다. 튜닙은 올해 들어 AI 기반 챗봇 서비스를 잇따라 내놨다. 지난 8월에 내놓은 여행 챗봇 ‘블루니’는 세계 어디든 다닐 수 있는 캐릭터다. AI 연구단체 오픈AI의 언어모델인 ‘GPT-3’에 기반으로 개발한 영어 챗봇이다. 해외 명소 등 여행을 주제로 한 가벼운 대화부터 깊이 있는 정보도 제공한다.
지난 5일에는 반려견 캐릭터 챗봇 코코와 마스의 시험 버전을 출시했다. 코코와 마스는 각각 다른 성격을 가진 강아지 캐릭터의 AI 챗봇이다. 이용자와 정서적 교감이 가능한 것이 특징으로 간식 주기, 산책하기 등 실제 반려견 같은 활동과 N행시 등 여러 게임을 함께할 수 있다. 문자의 이해를 넘어 사람과 정서적인 교감이 가능하도록 튜닙의 자체 개발한 언어모델로 1.2TB(테라바이트)에 달하는 양의 한국어 데이터를 학습시켰다. 코코와 마스는 카카오톡 채널에서 ‘DearMate 코코’, ‘DearMate 마스’를 친구로 추가하면 누구든지 이용 가능하다.
다양한 분야에서 쓰이는 NLP
구글코리아 연구개발(R&D) 총괄사장을 역임한 조원규 대표가 설립한 스켈터랩스도 챗봇을 앞세워 AI 서비스를 확대하고 있다. 스켈터랩스의 ‘AIQ(AI with Quality) 챗봇’은 높은 ‘의도 파악률’이 강점인 대화형 AI 솔루션이라고 회사 측은 설명했다. AIQ 챗봇은 스켈터랩스의 챗봇 기획 전문가가 고객사의 요구 사항과 관련 데이터를 기반으로 맞춤형 챗봇 시나리오를 직접 기획하는 방식으로 만든다. AIQ 챗봇의 지원 영역으로는 고객 문의 응대, 예약, 조회, 변경 사항 확인, 제품 소개 등이다. 롯데홈쇼핑, 퍼시스, 위대한상상(요기요) 등이 AIQ 챗봇을 사용하고 있다. 조 대표는 “고비용과 인력난 문제로 챗봇 도입을 망설이는 중소규모 사업자들의 디지털 전환을 돕기 위해 AIQ 챗봇의 공급 범위를 확대하고 있다”고 말했다.
글로벌 시장조사업체 CB인사이트가 매년 선정한 글로벌 ‘100대 AI 스타트업’에 올해 한국 기업으로 유일하게 이름을 올린 트웰브랩스도 NLP 업체다. 첨단 NLP와 컴퓨터 비전을 융합해 영상에서 원하는 장면을 찾는 기술을 개발했다. 이용자가 기억 나는 영화의 대사나 상황 묘사 등을 입력하면 해당 장면을 찾아낸다. 예를 들어 ‘아부지 뭐하시노’라고 치면 영화 ‘친구’의 교실 장면이 뜨는 식이다. 트웰브랩스은 기술력을 인정받아 지난 3월 시드(회사 설립 단계 투자)로 60억원을 유치했다. AI 분야의 세계적인 석학 페이페이 리 미국 스탠퍼드대 교수도 투자해 화제를 모았다.
NLP 스타트업 액션파워는 사람의 음성을 글자로 변화하는 서비스 다글로를 운영하고 있다. 지난 2017년에 나온 다글로는 자체 개발한 엔드투엔드(E2E) 음성인식 엔진을 채용해 정확도가 95% 정도라고 회사 측은 설명했다. 지원하는 언어는 한국어, 영어, 일본어, 중국어, 베트남어 등 총 14개다.
AI스타트업도 액션파워와 비슷한 서비스를 제공하고 있다. 리턴제로는 일명 ‘AI 전화’ 앱 비토는 통화 음성 내용을 글자로 바꿔주는 서비스다. 지난 7월에 나온 ‘비토 스피치’는 누구나 음성인식 문자변환 기술을 사용할 수 있는 오픈 API(응용프로그램 인터페이스) 솔루션이다. 리턴제로는 비토로 확보한 음성 데이터로 음성인식 정확도를 높인 AI 모델을 비토 스피치에 적용했다. 비토 관계자는 “비토의 핵심 기술인 소머즈 엔진은 한국어 특성상 정확히 인식하기 어려운 구어체와 자유 발화 등에 특화돼 소음에 노출된 통화 환경에서도 빠르고 정확한 텍스트 변환 기술을 보여준다”고 설명했다.
네이버와 카카오도 NLP 시장에서 경쟁
국내 정보기술(IT) 대기업들도 NLP 기술과 관련 서비스 개발에 회사 역량을 집중하고 있다. 이들은 NLP의 바탕인 일명 ‘초(超)대규모 AI’ 개발을 주도하고 있다. 네이버는 초거대 AI인 하이퍼클로바’를 지난해 처음 공개했다. AI 모델의 크기와 성능을 보여주는 매개 변수(파라미터)가 하이퍼클로바는 2040억 개다. 일론 머스크가 설립한 AI연구소 오픈AI의 ‘GPT-3(1750억 개)’를 넘어서는 수준이다. 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습했다는 것이 네이버 측 설명이다.
..........