사내 문화를 바꾸는 악성메일 신고센터

Table of Contents

데이터 보안 영역에서 시장을 선도하는 파수

혁신적인 솔루션과 서비스를 제공해 온 엔터프라이즈 소프트웨어 기업 파수. 파수는 데이터 보안 영역에서 국내를 넘어 글로벌 시장을 선도하고 있습니다. 특히 파수의 악성메일 훈련 및 교육 Mind-SAT은 내부 구성원들의 보안 의식을 높이고 실제 위협 상황에 대한 대응력을 강화하는 데 초점을 맞춘 서비스로 KT, 대한통운, 포스코, 동행복권 등 다양한 기업이 파수 Mind-SAT을 통해 조직의 업무 문화를 개선하고 보안 사고의 발생 가능성을 효과적으로 줄였습니다.

기업 내 생성형 AI 최신 학습 모델

앞에서 기업 전용의 생성형 AI 구축을 위해 데이터 학습 모델에 대해 알아 보았습니다. 최근에는 위 2가지 모델을 모두 활용하는 하이브리드 아키텍쳐 형태가 각광을 받고 있습니다. 전직원이 접근 가능한 기본적인 지식은 Fine Tuning을 통해 사전에 LLM에 학습 시키고 사용자별로 활용 가능한 문서는 벡터 DB화하여 사용자가 프롬프트에서 질의 시 이를 활용하게 하는 것입니다.

가장 중요한 것은 AI에 대응하기 위한 기업 데이터를 활용하여 DB화 하는 것입니다. 보고서, 매뉴얼, 회의록 등의 문서 자료가 핵심 데이터가 됩니다.

기업에서 고품질의 학습 데이터 준비의 어려움

생성형 AI 구축을 위해서는 기업 내 양질의 데이터, 나아가 비정형 형태의 문서가 가장 중요하다는 것을 이야기 했습니다.
하지만 기업에서 중요한 자산인 문서를 생성형 AI의 학습 데이터로 활용하기 위해 준비하는 과정은 많은 노력이 들어갑니다.
학습 데이터를 준비함에 있어 중요한 애로 사항에 대해 알아보도록 하겠습니다.

첫째, 개인들이 작성한 문서를 빠짐없이 다 모아서 DB화 해야 됩니다. 온라인상에 저장되어 있는 DB화된 데이터는 관리가 잘되어 활용이 쉬울 수 있지만 직원 개인이 작성한 문서의 관리가 되어 있지 않으면 학습 데이터로 활용하기 위해 수집하는데 상당한 시간과 비용이 발생할 수 밖에 없습니다.

둘째, 문서에 대한 접근 권한이 다르기 때문에 사용자에 따른 권한에 따라 접근이 관리되어야 합니다. 특정 사용자에게 접근이 허용되지 않은 문서가 노출될 경우에는 보안에 위협이 될 수 있기 때문에 권한 관리 또한 중요한 포인트입니다. 그리고 예전 데이터를 학습하여 잘못 보여 주면 안되기 때문에 최신 버전의 문서를 학습하여 답을 할 수 있도록 하여야 합니다.

셋째, 회사 내에 중복 데이터가 관리가 안되고 많을 경우 학습한 내용을 반복적으로 학습하게 되어 학습 효율이 저하될 수 있고, 모델 성능 저하, 중복 데이터가 많은 경우 AI 모델은 실제 데이터에 대한 적응력이 떨어져 모델 성능이 저하됩니다.

마지막으로 중복 데이터가 많은 경우 AI 모델은 실제 데이터의 편향을 반영한 결과를 생성할 수 있습니다.

Wrapsody를 이용한 효과적인 학습데이터 준비 및 적용

랩소디는 문서가상화 기술을 채택하여 생성형 AI 학습데이터를 효과적으로 생산 관리할 수 있는 플랫폼으로 진화하고 있습니다.
기업에서 향후 성공적인 생성형AI 구축을 위해 가장 필수적이고 어려운 고품질의 학습데이터 관리를 랩소디와 함께 지금부터 관리하면 비용 및 시간을 절감할 수 있다고 생각합니다.

AI 활용 동의

입력하신 정보는 OpenAI의 API를 활용해 오직 개인화된 셀프 테스트용 모의 훈련 메일 템플릿을 생성하는 데만 활용됩니다. 해당 정보는 AI 학습을 위해 사용되지 않습니다.

수집 목적
수집 항목
수집 근거
보유 기간
개인화된 훈련 메일 템플릿 생성
(필수) 이름, 회사명, 연락처, 이메일
정보주체의 동의
입력 후 30일

개인정보 수집 및 이용 동의

수집 목적
수집 항목
수집 근거
보유 기간
본인 확인, 셀프 테스트 이메일 발송, 도입 관련 상담 및 문의
(필수) 이름, 회사명, 연락처, 이메일
정보주체의 동의
정보 입력 후 1년