【 청년일보 】 2025년 1월 20일 중국 스타트업 Deepseek에서 오픈소스 LLM 모델인 Deepseek를 출시하며, 세계가 혼란에 빠졌다. 오픈소스 LLM의 최강자로 군림한 meta의 LLaMA와 Mistral, Gemma, Bloom 및 상업적으로 배포되고 있는 Open ai의 GPT모델에 비해 저비용을 통해 여러 벤치마크에서 좋은 성능을 보였다는 점에서 충격을 안겨주었다. 이렇듯, 생성형 AI에 대한 투자가 급속도로 빨라지면서, 이를 산업군에 올바르게 적용시키는 관점에서도 생각해볼 필요가 있다. 산업에서는 모델이라던지 신기술 적용에서의 신뢰성과 정당성, 설명가능성이 중요하다. 이런 측면에서 전통적인 기계학습 모델인 의사결정나무, 선형 회귀, 로지스틱 회귀의 분석 과정은 프로그램 소스코드로 투명하게 표현될 수 있었다. 하지만 최근의 딥러닝 기반 AI 알고리즘은 여러가지 대용량의 데이터를 통한 좋은 성능을 보여주지만, 세부적인 내부 작동 방식을 기존 소스코드처럼 명시하거나 해석하기 어려워 블랙박스 모델로 비유된다. 이러한 모델의 블랙박스의 구조 문제를 해결하고, 결정의 인과관계를 투명하게 규명하고자 하는 활동을 XAI(eXplainable AI)라고
【 청년일보 】 2010년대 후반, Transformer 기반 Attention 메커니즘을 활용한 언어모델 아키텍처를 바탕으로 다양한 거대 언어모델(LLM)이 등장했다. 2020년 OpenAI가 GPT-3를 출시한 이후, 인공지능의 급격한 발전이 촉발됐으며, LLM은 기존의 보조 도구에서 핵심 인프라로 자리 잡게 됐다. 이를 통해 산업과 공공 서비스 전반에 혁신이 일어나고 있으며, 특히 대화형 인공지능 서비스인 ChatGPT의 등장은 전 세계적으로 큰 주목을 받고 있다. LLM은 번역, 요약, 질의응답과 같은 언어적 기능을 강화해 다양한 서비스에 통합되거나, 새로운 혁신적 서비스로 사용되고 있다. 또한 다양한 외부 도구와 연동해 더 복잡한 과제를 수행할 수 있다. 자율 에이전트는 최소한의 인간 개입으로 목표를 달성하는 데 주목받고 있으며, AutoGPT와 같은 자율 에이전트가 등장하고 있다. LLM은 산업공학 분야에서도 적용될 수 있다. LLM은 복잡한 데이터 분석과 의사결정을 자동화하는 강력한 도구로 사용될 수 있으며, 생산 계획, 물류 최적화, 공급망 관리 등 다양한 분야에서 혁신을 이끌어낼 수 있다. LLM을 활용하면 더욱 신속하고 정확한 예측과 최적화