fbpx

Kimchi hill

역시 생성모델 (Generative AI)이 미래다


가트너가 ‘2022년 이머징 테크놀로지 하이프 사이클 (Hype Cycle for Emerging Technologies, 2022)’보고서를 발표하며, AI 자동화 및 가속화가 중요한 화두이며, 이를 위해 주목해야 할 기술로 제너레이티브 AI (Generative AI, 생성형 AI모델)를 선정했습니다

제너레이티브 AI란? 

제너레이티브 AI는 이용자가 AI에게 어떤 것을 만들어 달라고 요구하면, 그 요구에 맞춰서 결과를 만들어내는 인공지능을 말합니다. AI에게 특정 개념을 학습 시키는 것이 아니라 데이터 원본을 제공하고 나머지 부분을 예측하도록 유도해 그 과정에서 AI도 추상적인 표현을 배울 수 있도록 하는 모델입니다.

주어진 학습 데이터의 분포를 따르는 유사한 데이터를 생성하는 모델이기 때문에, 원본과 유사하지만 동일하지는 않은, 즉 실존하지는 않지만 있을 법한 새로운 디지털 이미지, 비디오, 오디오, 텍스트 또는 코드 등의 창작물을 연속적으로 만들 수 있습니다. OpenAI에서 공개한 이미지 생성 AI DALL·E가 하나의 예 입니다. 

DALL·E로 다양한 옷을 바꾸어가며 보여줌 (출처: 트위터@karenxcheng)

제너레이티브 AI 모델의 종류는? 

생성모델이 학습데이터와 유사한 샘플을 뽑는 방법에는 여러 방식들이 있는데, 대표적으로 학습 데이터의 분포를 기반으로 할 것인지(Explicit density) 혹은 그러한 분포를 몰라도 샘플링을 반복하여 특정 확률 분포에 수렴시키는 모델(Implicit density)로 나뉩니다. 

Model특징예시
Explicit densityTractable density – 모델의 사전분포를 가정하여 기존 값으로부터 데이터 분포를 추정Full Visible Belief Nets
– NADE
– MADE
– PixelRNN/CNN
Explicit densityApproximate density – 모델의 사전분포를 근사시켜 데이터 분포를 추정VAE
Markov Chain (Boltzmann Machine)
Implicit density데이터의 확률 분포를 모르는 상태 (즉 모델이 명확히 정의되어 있지 않은 대신)에서 샘플링을 반복하여 특정 확률 분포에 수렴시킴으로서 추정하는 모델GAN
Markov Chain (GSN)
GAN (Generative Adversarial Networks)AE (Auto-Encoder)VAE (Variational Auto-Encoder)
•GAN은 서로 대립하는 두 개의 네트워크를 만들고 대립 과정에서 훈련 타겟을 생성하는 방법을 알도록 학습시키는 구조의 모델로, 저차원 특징공간에서 시작하여 정규분포를 기반으로 바로 특징벡터를 샘플링하고 이를 원래의 이미지로 만들어낸다.
•두 개의 인공 신경망이 서로 적대적으로 경쟁하는 관계 속에서 하나의 인공신경망은 진짜 같은 가짜를 더 잘 만드는 생산에 집중하며, 다른 하나는 진위를 판별하는데 집중한다. 즉, 이들 두 인공신경망의 경쟁은 진짜같은 가짜를 만들어 낼 때 끝이 날 수 (무승부가 가능) 있는 생성적 모델이다.
•입력을 기반으로 특징을 추출하고, 추출된 특징으로 다시 원본데이터를 출력하는 네트워크. 라벨링 되지 않은 데이터로부터 저차원의 특징을 확습하는 비지도 학습.
•오토인코더는 인코더와 디코더로 구성되어 있는데, 인코더 고차원의 입력 데이터를 저차원 Latent-Vector (원본 이미지를 저차원 잠재공간으로 압축한 것) 로 압축하며, 생성네트워크 (generative network)라 부르는 디코더에서는 주어진 Latent-Vector를 원본차원으로 다시 압축해제함.
•AE 모델과 형태가 유사하지만 확률적 (probabilistic) 및 생성적 (generative) 개념이 추가로 활용되는 대표적인 Generative AI 알고리즘. 디코더로 새로운 데이터를 생성하기 위해 개발된 모델로 각 이미지가 다변수 정규 분포에 매핑되며 이전의 AE에서 인코더와 손실함수가 바뀌게 됩니다.
•입력데이터를 잘 설명하는 특징을 추출하여 Latent Vector Z에 담고, 이 Latent Vector Z를 통해 원 데이터와 유사하지만 완전히 새로운 데이터를 생성하는 것을 목표로 합니다. 이 때 각 특징은 가우시안 분포를 따른다고 가정하고, Latent z는 각 특징의 평균과 분산값을 나타냅니다.
주요 모델에 대한 상세 설명: GAN, AE, VAE

Generative AI 모델에 대한 관심이 급부상한 이유

OpenAI 의 GPT-3 (텍스트), DALL-E 및 Midjourney (텍스트 – 이미지), Google의 LaMDA (대화형) 등 이미 우리 주변에서 접할 수있는 이미 LLM (Large Language Models) 및 제너레이티브 ML 도구의 발전은 그 규모와 정교함이 매년 평균 10배씩 증가하고 있습니다. 그 결과 AI 가 만들어내는 다양한 멀티미디어 및 컨텐츠의 수준의 사람이 만들어 내는 그것과 동일한 수준에 이르렀다고 평가하는 벤치마크들이 속속들이 등장하고 있습니다.  

출처: BVP, The rise of synthetic media

더 많은 양의 데이터를 가지고 더 큰 모델을 학습시키도록 돕는 하드웨어의 발전, Transformer 아키텍처, 퓨샷러닝(Few-shot learning) 등의 출현이 이러한 기술발전의 가속화를 견인할 것이며, 제네레이티브 AI를 위한 다양한 오픈소스 및 private API (예. OpenAI, AI21 Labs) 접근성이 비약적으로 증가하여 제네레이티브 AI의 다양한 이용이 기대되는 바입니다. 

출처: BVP, Is AI generation the next platform shift?

제너레이티브 AI 기술은 어떻게 활용될까?

어떤 사람들은 제너레이티브 AI를 딥 페이크 및 데이터 저널리즘에 한정 지어 생각하지만, 제너레이티브 AI 기술은 디지털 이미지, 멀티미디어, 오디오 수정과 같은 반복적인 프로세스 자동화 뿐 아니라, 인공지능의 도움으로 만들어지거나 수정되는 미디어인, 합성 미디어 (Synthetic Media) 전반에 상당한 영향력을 행사할 것으로 예상됩니다. 또한 로봇 공학 프로세스 자동화( RPA )를 위한 데이터 증강 을 개선하기 위해 신속한 프로토타이핑 을 위한 도구로 제조 및 비즈니스에서 실험적으로 사용되고 있습니다. 

제너레이티브 AI는 B2C와 B2B 모두에서 실사용에 기반한 플라이휠 효과를 만들어내기 시작했습니다. (출처: BVP, The rise of synthetic media)

소비자 관점 (Consumer experience)

  • SNS/비디오 – ‘Volograms’ 은 일반 카메라로 촬영한 비디오를 다양한 버전의 증강현실 버전의 비디오 클립으로 바꾸어 줌
  • AI Companion – 스캐터랩의 ‘이루다’, Luka의 ‘Replika’와 같은 반려AI 서비스에서 수백만명의 사용자가 이미 하루에 수십개의 메시지를 주고 받음  
  • Game – LatitudeAI Dungeon은 사용자가 작성한 프롬프트를 기반으로, 허구의 시나리오에 기반한 게임을 제작함. 동사의 Voyage도 Immersive game 장르를 위함
  • Art:  DALL-E 2Midjourney 는 텍스트를 이미지로 변환하여 사실적인 이미지를 독특한 예술 작품으로 바꾸거나, 새로운 동영상/이미지 제작이 가능함 

프로슈머의 생산성 개선을 위한 제작툴 (Creator’s tool)

  • Writing: 이미 잘 알려진 Grammarly 외에도, 지정된 어조로 문장을 고쳐쓰는 부분에 강점을 가진  Wordtune, 텍스트를 요약해주는 QuillBot 등도 생겨남 
  • Visual: 보다 전문적으로 사진의 배경을 제거해주는 Photoroom, 구글 문서와 같이 간단한 입력만으로 공동의 동영상 편집을 쉽게 도와주는  Reduct.video. 그 외에도  RunwayMLSimplified와 같은 회사가 있음 
  • Audio: Descript 로 오디오 편집의 생산성 개선, Resemble.ai 로 AI 보이스,  Boomy and Splash에서는 AI를 이용한 음악 제작에 활용되고 됨. 아마존의 DeepComposer는 짧은 멜로디를 하나의 노래로 제작 
  • Multimodeal / synthetic repurpose: Munch는 하나의 컨텐츠를 다양한 채널과 포맷에 맞도록 생산해 주는 툴 

B2B 및 기업에서의 활용

  • AI-copilots for sales
    • Synthesia, Tavus, Hour One ,D-IDColossyan 과 같은 회사의 AI 생성 비디오 솔루션을 통해 매력적인 데모, 세일즈 피치 및 온보딩 비디오를 제작
    • MagicSalesBot 과 같은 솔루션 은 영업 팀을 위한 “콜드 아웃리치” 이메일의 AI 생성을 도움
  • 마케팅을 위한 AI 카피라이터 및 에이전시
    • 카피라이팅 및 콘텐츠 제작을 위해 Jasper , Copy.ai, Pepper ContentWriter 와 같은 AI 작성 도우미를 활용 가능 
    • Replier는 마케팅 혹은 고객지원 팀이 고객 리뷰에 응답하는 것을 돕는 솔루션
  • AI의 보조를 받은 음성 및 챗봇에 기반한 고객지원/고객상담
    • Alta Voce 콜센터에서 배경 노이즈 제거에 탁월한 도움을 제공
    • Sapling Intelligence 은 GPT-3를 메시징 솔루션에 통합해 고객이 질문한 사항에 대해 권장하는 답변을 제안하거나 자동생성하는 것을 도와줍니다. 

어떤 사람들은 제네레이티브 AI 기술이 소설을 쓰거나 예술 작품을 만들어 인간의 창의성을 시뮬레이션하는 것에 우려를 표하곤 합니다. 결국 이것은 기술의 한계와 그것이 우리 삶에 미치는 영향에 대한 보다 일반적인 논쟁으로 이어집니다. 제너레이티브 AI가 인간의 작업을 완전히 대체할 것으로 생각할 수 있지만, 이와 같은 신기술에는 종종 HITL(Human In the Loop) 요소가 있으며, AI가 인간이 더 빠르고 정확한 결과를 생성하도록 돕는 보조 기술로 특징지는 상황에서 증강 인공 지능으로 포지셔닝 되곤 합니다.

증강인공지능을 통한 프로그래밍 및 제품 개발 


윤리적 차원에서 논의되는 AI의 편향성은 많은 경우 학습데이터에 영향을 받는 AI의 일반적인 특성에서 비롯되었습니다. 이러한 문제에 대한 해결책으로 주목받는 것이 바로 데이터 생성모델인 제너레이티브 AI 입니다.

또한 익명화된 데이터의 재식별 가능성으로 문제가 될 수 있는 정보보호의 이슈에서, 생성모델은 단순히 데이터를 익명화하는 것을 넘어 기존 데이터와 유사한 데이터를 생성하여 재식별 문제를 해결할 수 있을 것으로 기대됩니다.

현재 제너레이티브 AI를 이용한 사업모델은 번역, 컨텐츠 제작과 같은 수평적 사업모델 (horizental use case) 혹은 엔지니어링 / 프로그래밍 영역에서 먼저 시범을 보이고 있습니다. 하지만, B2B와 SaaS의 주요 성장 무대인 보안, 생산성, 운영 조직의 효율화에서 새로운 사업모델과 스타트업이 급부상하기를 기대하고 있습니다.


개선점 (Feedback) – 위의 예시 중에서도 “생성 모델”이 아니라 “편집 기술”을 사용한 것이 좀 있어 보이는데, 생성 모델을 사용한 서비스와 편집 기술을 사용한 서비스를 확실히 구분해서 업데이트를 하겠습니다

One thought on “역시 생성모델 (Generative AI)이 미래다

Leave a Reply