안녕하세요. 이승호 전문가입니다.
그 질문에 대한 답은 생각하신 내용이 정확히 맞습니다. 로컬 LLM이 언어를 지정하지 않았을 때 파이썬으로 코드를 짜주는 가장 큰 이유는 학습 데이터의 양과 가중치가 파이썬에 압도적으로 쏠려 있기 때문입니다.
오픈소스 모델들의 기반이 되는 인터넷상의 수많은 소스코드 데이터 중에서 파이썬은 가장 큰 비중을 차지합니다. 특히 AI 모델을 학습시킬 때 사용하는 깃허브나 코드 저장소에서 파이썬은 기계학습, 데이터 분석, 그리고 질문자님이 언급하신 자동화 스크립트 분야에서 표준처럼 사용되는 언어입니다. 모델 입장에서는 어떤 언어로 짜야 할지 모호한 상황이 주어지면, 통계적으로 가장 성공 확률이 높고 데이터가 많았던 파이썬을 선택하는 것이 일종의 기본값으로 굳어진 것입니다.
여기에 추가적인 이유를 더하자면 자동화라는 단어 자체의 특성도 있습니다. 컴퓨터공학 데이터에서 시스템 자동화나 스크립트 작성이라는 맥락은 파이썬과 매우 강력하게 연결되어 있습니다. 모델이 자동화 스크립트라는 단어를 인식하는 순간, 그와 관련된 연관 단어나 코드 패턴으로 파이썬이 가장 먼저 연상되도록 가중치가 활성화됩니다.
또한 파이썬은 문법이 인간의 자연어와 유사하고 간결해서 모델이 코드를 생성할 때 토큰을 효율적으로 사용할 수 있다는 기술적인 이점도 있습니다. 결국 AI 모델이 가진 지식의 지도에서 자동화와 스크립트라는 영역의 중심에 파이썬이 자리 잡고 있기 때문에 발생하는 자연스러운 현상입니다.