제목: 대규모 언어 모델 기반 정보 검색 시스템의 단점
- 검색 엔진은 개인화되지는 않았지만 검색 엔진이 표준이 되기 전에는 사서나 검색 전문가가 관련 정보를 제공하는 것처럼 대화형, 투명하고 권위 있는 검색 엔진이었습니다.
- Bing/ChatGPT, Google/Bard, Meta/LLaMA 등 새로운 세대의 AI 기반 정보 검색 시스템이 기존의 검색 엔진을 대체하고 있습니다. 이러한 시스템은 전체 문장과 단락을 입력으로 받아 개인화된 자연어 응답을 생성합니다.
- 이러한 AI 시스템은 머신 러닝 기법을 사용하여 Wikipedia 및 PubMed 논문과 같은 대규모 텍스트에서 패턴을 학습하는 대규모 언어 모델을 기반으로 구축됩니다.
- 대규모 언어 모델 기반 시스템은 정보 쿼리를 효과적으로 처리하기 위해 개인화된 응답을 생성하므로 사용자들 사이에서 인기가 높습니다.
- 그러나 이러한 시스템은 투명하지 않으며 응답의 정확성, 유효성 및 어트리뷰션이 부족할 수 있습니다. 또한 답변을 지어내거나 '환각'을 불러일으키기 쉬우며, 투명성이 부족하여 원본 콘텐츠 소스의 수익원을 감소시킬 수 있습니다.
- 또한, 대규모 언어 모델은 기존 검색 엔진이 제공하는 다양한 가능성과 연결성을 탐색하는 데서 오는 학습과 우연성을 앗아갈 수 있습니다.
- 대규모 언어 모델은 자연어 기반 상호 작용, 개인화된 응답, 답변 및 패턴 발견을 위한 방법을 제공하지만, 학습 및 응답 구성 방식에 따른 한계로 인해 정보가 부족한 사용자에게는 독성, 편향성, 위험성을 초래할 수 있습니다.
|