뉴욕타임스가 ChatGPT, Claude, Google Gemini, Grok 등 4개 주요 AI 챗봇을 대상으로 실시한 테스트에서 놀라운 결과가 나왔습니다. 모든 AI가 올바른 세금 양식을 선택하고 작성하는 데 어려움을 겪었으며, 핵심적인 계산 과정에서 실수를 반복했습니다.
가장 심각한 문제는 계산 오류의 규모입니다. AI들이 국세청에 내야 할 세금을 평균 2천 달러 이상 잘못 계산했다는 것은 단순한 실수 수준을 넘어서는 문제입니다. 이는 노스캐롤라이나 중산층 가정의 한 달 생활비에 해당하는 금액으로, 실제 세금 신고에서 이런 오류가 발생한다면 가정 경제에 심각한 타격을 줄 수 있습니다.
기술 분석가 베네딕트 에반스는 “세금 문제에서는 아주 작은 세부사항들이 모두 중요한데, AI는 모든 세부사항을 정확히 처리하지 못한다”고 지적했습니다.
복잡한 미국 세법과 AI의 한계
미국의 세법은 세계에서 가장 복잡한 시스템 중 하나로 알려져 있습니다. 특히 한인 이민자들이 자주 접하는 상황들, 예를 들어 한국과 미국 간의 이중과세 방지협정 적용이나 외국인 배우자와의 합산 신고, 해외 금융계좌 신고 의무 등은 매우 구체적이고 정밀한 처리가 필요합니다.
AI는 대량의 정보를 처리하고 요약하는 데는 유용하지만, 정확성이 요구되는 영역에서는 한계를 보입니다. 챗봇들은 종종 사실이 아닌 정보를 만들어내기도 하며, 단일 문서를 요약할 때조차 잘못된 내용을 포함시키는 경우가 빈번합니다.
스탠포드 인공지능연구소의 에릭 브린욜프슨 선임연구원은 “터보택스나 택스액트 같은 기존 세금 소프트웨어는 수학적 정확성을 위해 구축된 ‘만약-그러면’ 논리를 따르지만, 대형 언어 모델은 예측 엔진이어서 많은 작업에서 뛰어날 수 있지만 인간에게는 더 간단해 보이는 일부 작업에서 실패할 수 있다”고 설명했습니다.
실제 사례로 본 AI 세금 도구의 문제점
AI 세금 도구의 문제점은 이론적인 것이 아니라 실제로 검증된 사실입니다. 터보택스에서 개발한 “인튜이트 어시스트” 챗봇은 세금 관련 질문에 답변할 때 관련 없는 답변을 제공하거나, 주제와 관련이 있더라도 틀린 정보를 제공하는 경우가 많았습니다.
뉴욕타임스 테스트에서 AI들이 더 나은 성과를 보인 경우는 오직 매우 구체적인 지시사항을 제공받았을 때뿐이었습니다. 예를 들어 각 정보가 어느 국세청 양식의 어느 부분에 들어가야 하는지를 상세히 알려준 후에야 AI가 올바른 처리를 시작했습니다.
하지만 이는 자동화 도구를 사용하는 본래 목적과 모순됩니다. 일반 사용자들이 비싼 세금 소프트웨어를 사용하는 이유는 복잡한 절차를 모르기 때문인데, 결국 사용자가 모든 세부사항을 알고 있어야만 AI가 제대로 작동한다는 것은 의미가 없습니다.
노스캐롤라이나 한인들을 위한 안전한 세금 신고 방법
그렇다면 노스캐롤라이나 한인들은 어떻게 안전하고 정확하게 세금 신고를 해야 할까요? 가장 확실한 방법은 여전히 검증된 기존 도구들을 활용하는 것입니다.
첫째, 터보택스나 택스액트 같은 기존 세금 소프트웨어를 사용하시기 바랍니다. 이들 프로그램은 수십 년간의 개발과 검증을 거쳐 수학적 정확성을 보장하는 시스템을 갖추고 있습니다.
둘째, 복잡한 세무 상황이 있는 경우에는 한인 세무사나 공인회계사(CPA)의 도움을 받으시기 바랍니다. 특히 한국과 관련된 해외 소득이나 자산이 있는 경우, 이중과세 방지협정 적용이 필요한 경우에는 전문가의 조언이 필수적입니다.
셋째, AI를 완전히 배제할 필요는 없지만, 최종 결정이나 계산에는 의존하지 마시기 바랍니다. AI는 세금 용어나 개념을 이해하는 참고 도구로만 활용하고, 실제 신고서 작성은 검증된 도구나 전문가를 통해 진행하시기 바랍니다.
현재 AI 기술은 빠르게 발전하고 있지만, 세금 신고처럼 정확성이 생명인 영역에서는 아직 신뢰할 수 있는 수준에 도달하지 못했습니다. 개인 상황에 따라 다를 수 있으니 복잡한 세무 사항이 있으시면 전문가와 상담하시기 바랍니다.








