앨리비 테크
법률 전문가처럼 생각하는 앨리비의 리걸AI
단계적 추론(Reasoning)이 적용된 리걸AI는 어떤 모습일까?
2025-03-31

1. 리걸, 왜 AI에게 어려운 과제인가?

최근엔 어딜 가나 AI에 대한 이야기로 떠들썩합니다. 사람처럼 말을 잘 하는 AI에 대해 놀란지 몇 년 지나지 않아, 이제는 일상 대화에서부터 전문분야의 글쓰기까지 다양한 분야에서 AI의 활약을 마주하고 있는 시대가 왔습니다.

그런데 계약서나 법률 문서 검토와 같은 전문 영역에서는 AI가 여전히 한계를 보입니다. 단순히 "이 계약서는 문제가 있나요?"라고 물으면 일반 AI는 표면적인 답변만 제공할 뿐, 정확한 법적 판단 근거나 체계적인 분석을 제공하지 못합니다.

앨리비는 이 문제를 해결하기 위해 단순 텍스트 생성 방식이 아닌, 법률 전문가처럼 단계적으로 사고하는 '추론형 리걸AI'를 개발하게 되었습니다. 이 글에서는 AI가 단순 응답을 넘어 어떻게 법률적 추론 과정을 구현하는지, 그리고 앨리비의 접근법이 어떤 차별점을 가지는지 살펴보겠습니다.

Deepseek의 부상과 AI 추론(Reasoning)의 새로운 물결

2024년 말부터 AI 업계에서 가장 주목받은 변화 중 하나는 중국 스타트업 Deepseek의 부상과 함께 시작된 'Reasoning'에 대한 재조명입니다. Deepseek는 기존 AI 모델들과 달리 복잡한 수학 문제나 논리 퍼즐을 단계적으로 해결하는 능력에서 두각을 나타냈습니다.

이러한 발전은 단순한 성능 향상 이상의 의미를 가지는데요. AI가 단순히 '다음 단어를 예측하는 확률 모델'에서 '단계적으로 문제를 풀어나가는 사고 엔진'으로 진화하고 있음을 보여주는 사례이기 때문입니다. 특히 법률, 의학, 금융과 같은 전문 분야에서는 단계적 사고와 근거 기반 결론 도출이 필수적인데, Deepseek의 성공은 이러한 전문 영역에서 AI의 실질적 활용 가능성을 크게 높였습니다.

앨리비는 이러한 업계 트렌드에 주목하며, Reasoning 기술을 법률 분야에 특화시키는 연구를 진행해왔습니다. 아래 글에서는 앨리비가 단순한 질의응답이 아닌, 법률 전문가의 사고 과정을 모델링한 단계적 추론 시스템을 어떻게 구축하고자 했는지 설명해 보려고 합니다.

2. AI의 기본 작동 원리: 토큰 생성과 예측에서 추론으로

일반 AI는 단순 예측에 기반합니다

대형 언어 모델(LLM)은 겉보기에 사람처럼 사고하는 것 같지만, 기본적으로는 패턴을 파악하고 다음에 올 단어를 확률적으로 예측하는 시스템에 불과합니다.

이를테면 "동해물과 백"이라는 입력에 대해 "두"가 나올 확률이 가장 높고, 그 다음으로는 "산"이 나올 확률이 높다는 패턴을 방대한 데이터를 통해 학습한 것이죠.

LLM inference process illustration. (EOS: end-of-sequence). Image Credit: ResearchGate

더 자세하게는, 위의 도식도처럼 "Is apple a fruit?"이라는 질문에 대해 LLM은 다음 단어로 "Yes", 그 다음 단어로 "it", 그 다음 단어로 "is"를 수십만 개의 가능한 단어들 중에서 각 단계마다 가장 확률이 높은 것을 선택하여 생성합니다.

즉, y = ax + b 와 같은 형태의 함수에서 출력값 y를 예측하는 형태입니다. 여기서 만약 x가 키이고, y가 몸무게라면, a는 x가 1단위 증가할 때 y가 증가하는 양을 의미합니다.

딥러닝 기반의 LLM은 이러한 기본 개념을 수십 또는 수백 개의 층(layer)으로 구성된 복잡한 신경망을 통해 구현합니다. 이런 다층 구조는 비선형적 특성을 가지고 있어 사람이 직관적으로 해석하기 어렵지만, 본질적으로는 다양한 토큰 내에서 다음 토큰(y)을 예측한다는 면에서 위의 방정식과 같은 메커니즘을 갖고 있습니다.

이처럼 학습(train)과 대비해 학습된 모델을 바탕으로 y라는 출력값을 산출하는 과정을 inference라고 부르게 됩니다. 일반적인 AI 모델들은 이러한 inference 방식으로 계약서 검토 요청에 단순 답변을 제공합니다.

3. 단계적 사고를 위한 '추론(Reasoning)'기술의 등장

질문에 대한 답변 추론: *Test-time Scaling “REASONING”

*Test-time은 training과 대비되는 학습이 완료된 이후라는 의미로 Inference와 별도로 test라고 부르기도 합니다.

2025년 CES에서 언비아이와 젠슨 황이 강조한 스케일링 법칙에 대한 이야기 (이미지 출처: NVIDIA 공식 유튜브 채널)

최근의 AI 기술은 Inference를 넘어 답을 사고하는 추론(Reasoning)영역으로 확장되고 있습니다.

그렇다면 여기서 Reasoning(논리적 추론)이란 무엇일까요? 이는 인간이 문제를 해결하거나 새로운 결론에 도달하기 위해 "근거를 단계적으로 따져가며 생각을 전개하는 과정"을 의미합니다.

이러한 Reasoning 접근법은 Chain-of-Thought(CoT, 연쇄 사고)라는 기법으로 구현됩니다. 이는 복잡한 문제를 한 번에 해결하려 하지 않고, 여러 사고 단계를 명시적으로 표현하며 해결해 나가는 방식입니다.

예시: 수학 문제를 푸는 두 가지 접근법

‍질문: 6-2*3=?

1. Inference 접근법

LLM이 즉시 ‘12’라는 답변을 생성 및 출력

2. Reasoning 접근법

➡️ 먼저 2*3=6 계산

➡️ 다음으로 6-6=0 계산

➡️ 최종 결과 '0' 도출

이처럼 추론 과정을 명시적으로 보여주는 방식은 특히 법률과 같은 복잡한 전문 분야에서 중요합니다. 일상 대화에서는 단순 응답도 충분할 수 있지만, 계약서 분석이나 법적 판단에서는 체계적인 사고 과정이 필수적이기 때문이죠.

4. 앨리비의 리걸AI: 법률 전문가의 사고 과정을 담다

앨리비에 구현된 Reasoning 기반 리걸AI

최근 앨리비는 Pre-Training과 Post-Training을 거쳐 Test-Time Computing 분야에도 많은 연구와 개발을 진행하고 있습니다.

특히 법률 문서의 정확한 해석에는 단순한 답변 생성보다는 쟁점 파악과 판단 기준의 적용이 중요하기 때문에, 앨리비의 리걸AI 모델은 해석의 정확도와 논리적 추론(Reasoning)분야의 발전에 중점을 두고 있습니다. 특히 최근 주목받고 있는 Test-Time Scaling기법을 적극 활용해 리걸AI가 다각도로 분석함으로써 더욱 심도 깊고 정확한 판단을 하도록 구현하고 있습니다.

앨리비 리걸AI의 법률 추론 프로세스

1️⃣ 체크리스트 검토
법률 전문가가 작성한 체크리스트를 기반으로 계약서의 각 조항을 체계적으로 분석하여 필수 항목을 추출하고 중요 사항을 점검합니다. 이는 마치 변호사가 계약서를 검토할 때 핵심 요소를 체크하는 과정과 유사합니다.

2️⃣ 문맥 해석
체크리스트 항목과 계약서 문구를 종합적으로 분석하고, 추가적인 추론을 통해 표면적 의미를 넘어 법적 함의까지 파악합니다. 문맥에 맞게 조항의 의미를 해석하는 이 과정은 법률 검토의 핵심입니다.

3️⃣ 위험성 평가
문제점 발견 시 명확한 판단 기준과 함께 위험성을 제시합니다. 단순히 "이 조항은 문제가 있습니다"가 아니라, 어떤 법적 근거에서 문제가 되는지, 어떤 위험이 있는지 구체적으로 설명합니다.

4️⃣ 수정 제안
발견된 문제에 대해 실무에서 즉시 활용 가능한 구체적인 수정안을 제공합니다. 이는 단순 분석을 넘어 실질적인 솔루션까지 제공하는 앨리비 리걸AI의 차별점입니다.

5. 일반 AI와 앨리비 리걸AI의 실제 비교: 같은 질문, 다른 답변

그럼, Test-Time Computing의 장점을 활용한 앨리비 리걸AI 계약서 리뷰 기능의 실제 사례를 통해, 단순히 답변만 출력하는 기존 모델과 다른 앨리비의 강점을 살펴보겠습니다.

먼저 추론 과정 없이 단순히 텍스트 생성만 수행하는 일반적인 AI 모델의 계약서 검토 사례를 살펴보겠습니다.

일반 AI의 한계: 단순 응답과 부족한 근거

보시는 바와 같이 일반적인 AI 모델은 질문에 대해 즉각적인 답변을 출력하는데에 특화되어 있습니다.

예를 들어, "이 계약서 조항은 적절하게 작성되었나요?" 라는 질문을 할 경우, 해당 조항이 적절한지 아닌지에 대한 여부만 간략하게 답변하므로, 사용자는 답변의 근거나 세부사항들을 파악하기 어렵습니다.

이런 접근법은 빠르지만, 계약 실무자가 실제 수정 작업을 진행하려면 여전히 많은 질문이 남습니다.

✅ 왜 이 조항이 문제인가?

✅ 어떤 법적 근거에서 위험한가?

✅ 어떻게 수정해야 하는가?

앨리비 리걸AI의 차별점: 단계적 추론과 전문적 제안

반면 앨리비의 Reasoning 기반 계약서 분석은 체크리스트를 기반으로 단계적이고 체계적인 사고 과정을 통해 사용자에게 근거 중심의 상세한 검토 결과를 제공합니다. 아래는 앨리비의 실제 분석 사례입니다.

앨리비 리걸AI의 계약서 리뷰는 법률 전문가가 사전에 작성하고 검토한 전문적인 체크리스트 가이드라인에 따라 필수 항목을 점검하며 분석을 수행합니다.

위 사례에서 볼 수 있는 가이드라인은 앨리비 팀 내 법률 전문가들이 직접 작성한 것으로, 상법 69조와 같은 법령을 기준으로 매도인의 권리 보호 측면에서 적절한 검수기간이 설정되었는지를 검토하도록 구성되어 있습니다. 이처럼 앨리비 AI 계약서 리뷰 모델은 계약서 조항을 검토하여 해당 가이드라인의 위반/준수 여부를 판별하게 됩니다.

또한, 앨리비는 전문가가 작성한 가이드라인과 계약서 문맥을 고려하여 추가적인 추론을 진행합니다. “AI 분석”기능이 바로 그것인데요.

해당 기능은 계약서 내용을 상세히 분석한 뒤 가이드라인을 어떤 이유로 위반 혹은 준수하고 있는지를 설명하고 어떤 방식으로 고치면 좋을지 수정안도 함께 제안합니다.

이때 앨리비 리걸AI의 추론은 법률 전문가가 작성한 가이드라인을 기반으로 동작하기 때문에, 환각 현상이 적고 전문적인 답변이 가능해집니다.

앨리비의 법률 특화 추론 AI 선택

앨리비가 법률 분야에 Reasoning기법을 활용해 최적화된 접근법을 선택한 이유는, 법률 문서 분석이 아래와 같은 특성을 지니기 때문입니다.

1️⃣ 정확성이 속도보다 중요: 잘못된 법률 검토는 심각한 결과를 초래할 수 있음

2️⃣ 복잡한 논리 구조: 계약서의 조항들은 상호 연관되어 복합적 분석 필요

3️⃣ 전문성 요구: 법률 지식과 추론 능력의 결합이 필수적

4️⃣ 근거 기반 판단: 결론뿐 아니라 왜 그런 결론에 이르렀는지 설명 필요

이러한 이유로 앨리비는 단계적 추론 프로세스를 개발하고, 법률 전문가의 지식을 AI 시스템에 접목시켰습니다. 이를 통해 단순 텍스트 생성 모델의 한계를 넘어, 실질적인 법률 검토 도구로서의 기능을 구현했습니다.

6. Reasoning의 부상과 앨리비가 지향하는 리걸AI

AI 기술의 패러다임이 Inference에서 Reasoning으로 변해감에 따라, 앨리비는 이러한 변화를 선도적으로 법률 AI 서비스에 도입하고 있습니다. 체계적인 단계별 사고 과정을 통해 계약서 분석과 검토를 수행하는 앨리비의 접근 방식은 단순한 문서 처리를 넘어, 전문적인 법률 지식을 보조하는 진정한 AI 협업 시스템을 구현하고자 노력하고 있습니다.

앨리비는 이러한 노력을 통해 법률 서비스의 효율성과 접근성을 높이고, 법률 전문가들에게 더욱 신뢰할 수 있는 AI 협업 도구를 제공하겠습니다. 단순한 텍스트 생성을 넘어, 체계적인 법률적 사고 과정을 구현한 앨리비 리걸AI와 함께, 더 정확하고 효율적인 법률 서비스의 미래를 그려나가겠습니다.

AI를 통한 업무 혁신, 앨리비로 시작해보세요!
아래 링크를 통해 신청하시면 14일간 무료로 사용해보실 수 있습니다.
14일간 무료 사용 신청하기
(재)행복나눔재단 SIT(Social Innovators Table)팀
서울시 용산구 장문로 60 (동빙고동) 02-333-3963
수신거부 Unsubscribe
SNS에 공유하기
URL 복사 완료