국민과 함께 GMO 정보를 담고, 나눕니다


| 바이오 FOCUS |

합성생물학과 인공지능 시대의

DSI와 다자이익공유


이대희 (한국생명공학연구원 합성생물학연구센터장) 




오늘날 우리는 정보로 생명을 설계하는 시대에 살고 있다. DNA 염기서열이라는 정보는 더 이상 단순한 분자 구조의 나열이 아니라, 생명체의 설계도를 의미한다. 합성생물학은 이 정보를 바탕으로 새로운 생명 기능을 구현하며, 인공지능(ArtificialIntelligence, AI)은 이러한 과정의 속도와 정밀도를 혁신적으로 끌어올리고 있다. 합성생물학과 인공지능의 비약적 발전은 농업, 환경, 의약, 화학 등 전방위적 산업의 혁신을 통해 글로벌 바이오경제 구현을 앞당기고 있다. 따라서 디지털서열정보(DigitalSequence Information, DSI)는 단순한 데이터가 아닌 ‘설계 기반 자산’으로서의 전략적 가치가 높아지고 있다(그림 1).

(그림 1) DSI(디지털 염기서열 정보)의 생산과 활용

DSI는 유전체, 전사체, 단백질체 등의 생명체에서 유래한 서열 정보를 디지털 형태로 표현한 것이다. 이러한 정보는 주로 고속 유전체 분석기술(Next-Generation Sequencing, NGS)에 의해 생성되며, 대부분 EMBL-EBI, NCBI, DDBJ 등 국제 공공 데이터베이스에 등록되어 공유된다(그림 2).

(그림 2) 국제 염기서열 데이터베이스 협력체(INSDC)를 구성하는 세 기관, NCBI, EMBL-EBI, DDBJ

DSI의 생산 주체는 매우 다양하다. 학술기관, 공공연구소, 민간 생명정보 기업, 심지어 개인 연구자도 데이터 생성과 공유에 기여할 수 있다. 대부분의 DSI는 공공 연구성과로 생성되며, 자유로운 접근과 재사용이 가능하다는 점에서 그 가치가 높다. 이런 변화 속에서 디지털 자산의 활용과 이익공유에 대한 국제적 논의가 본격화되고 있다. 최근에는 그 활용에 따른 이익공유 문제와 함께, DSI를 보호하고 공정하게 공유해야 한다는 윤리적·법적 논의가 활발히 이루어지고 있다.

생물다양성협약(CBD)은 2022년 제15차 당사국총회(COP15)에서 DSI를 이익공유의 대상으로 포함하기로 결정했고, 2026년 COP17에서는 이를 제도화 할 예정에 있다. 즉, DSI의 이익공유 체계 도입은 과학기술 연구와 바이오경제 산업 전반에 걸쳐 크고 작은 파급 효과를 가져올 것이다(그림 3).

(그림 3) 디지털 염기서열 정보(DSI) 시대의 유전정보데이터베이스 생태계

합성생물학은 생명 시스템을 설계하고 제작하는 공학적 접근으로, DSI는 그 출발점이자 핵심 자원이다. 세포 없이 생명 기능을 재현하거나, 존재하지 않는 생명체 기능을 새롭게 만들어내는 합성생물학의 설계-제작-시험-학습 사이클(Design-Build-Test-Learn, DBTL)은 DSI 없이는 불가능하다. DSI는 단순한 분석 대상이 아니라, 직접적인 실물화가 가능한 설계 기반으로 작동한다. 한국생명공학연구원의 바이오파운드리에서는 이 DSI를 기반으로 다양한 생물학적 시스템이 자동화된 방식으로 구축되고 있다. 유전자 합성, 유전자 재조합 라이브러리 구축, 대사경로 최적화, 단백질 기능 탐색까지 일련의 실험들이 로봇 장비와 데이터 기반 분석으로 수행되며, 수천 건의 유전자 조합 실험이 단 며칠 만에 완료된다. 이 과정에서 사용되는 DNA 서열 정보, 단백질 도메인 정보, 효소 활성 데이터 등은 모두 DSI에서 비롯된다.

특히 유전자 합성 기업과 협업해 DSI 기반의 고정밀 DNA 합성 기술을 확보하고, 이를 바탕으로 맞춤형 대사공장 미생물 설계가 가능해졌다. 이는 단순한 연구를 넘어 산업적 응용으로 확장되고 있으며, DSI의 전략적 가치 또한 더욱 부각되고 있다. AI는 DSI의 활용 가치를 혁신적으로 확장시키고 있다. 특히 자연어처리(Natural Language Processing, NLP) 기반의 대형언어모델(Large Language Model, LLM)은 유전자 서열을 언어처럼 해석하고, 예측 모델을 학습시켜 유전자 기능을 추론하거나 새로운 생명 시스템을 설계하는데 활용된다. AlphaFold는 단백질 구조 예측에서 획기적인 성능을 보이며 단백질 공학의 패러다임을 전환시켰고, ProteinMPNN, ESM-2, ProtT5 등 다양한 AI 모델은 생명정보의 해석과 설계 자동화를 가속화하고 있다. 한국생명공학연구원의 합성생물학연구센터에서는 이러한 AI 모델을 활용해 메타지놈 데이터로부터 유용 유전자를 자동 탐색하고, 대사경로 시뮬레이션을 통해 최적 설계를 도출하는 연구를 수행 중이다. 예를 들어, 환경에서 추출된 미생물의 DSI를 입력하면 AI가 항생제 생산 능력을 예측하고, 그 유전자를 합성하여 미생물에 도입하는 방식이다. 이처럼 AI와 DSI의 결합은 실험의 시간과 비용을 획기적으로 줄이며, 과거 수년이 걸리던 바이오제품 개발을 단 몇 주로 단축시키고 있다(그림 4).

(그림 4) 디지털 염기서열 정보(DSI)와 합성생물학의 설계-제작-시험-학습 사이클

이처럼 중요한 자원이 된 DSI는 국제적 차원에서도 그 활용과 이익공유에 대한 관심이 높아지고 있다. 이에 따라 유전자원 이용자는 기금을 통해 이익을 환류하게 되며, 디지털 기반의 자산이 처음으로 국제 분배 체계에 편입되는 것이다. 


현재 제안된 다자체계는 ①제약 ②건강기능식품 ③화장품 ④동식물 육종 ⑤생명공학 ⑥시약 및 분석장비 ⑦DSI 기반 정보서비스 등 7개 분야에서 DSI를 활용할 경우 일정한 기여를 의무화하는 구조다(그림 3). 하지만 정보의 출처를 추적하는 것은 현실적으로 어려우며, 정보 자체만으로는 활용 목적을 구분하기 어렵다. 또한, 중소기업이나 학술기관까지 부담을 지게 될 경우 오히려 연구와 기술혁신을 위축시킬 수 있다는 우려도 있다. 기초연구와 상업화의 경계가 모호한 만큼, 이익공유의 시점과 범위, 적용 대상에 대해 명확한 정책적 기준이 마련되어야 한다. DSI는 무형의 디지털 자산이라는 특성상 물리적 통제나 실물 기반 과세와는 전혀 다른 접근이 요구된다. 단순한 데이터 접근 제한보다는, 데이터의 가치 실현 과정 과 상업적 환류 구조를 고려한 유연한 제도가 필요하다. 이를 위해 다음과 같은 고려가 필요하다.

첫째, 연구와 상업화를 명확히 구분하고, 기초연구 단계에서는 자유로운 데이터 접근을 보장해야 한다.

둘째, 다자체계 기여는 금전적 납부만이 아니라 기술교육, 플랫폼 제공, 사회적 기여 등 다양한 방식으로 구성되어야 한다. 

셋째, 국제연구 협력을 저해하지 않는 범위 내에서 제도가 설계되어야 하며, 글로벌 연구자의 참여를 유도할 수 있어야 한다.

디지털 자산 시대의 도래는 생물정보 주권, 과학기술 주도권, 산업 경쟁력의 3대 축을 동시에 시험대에 올려놓고 있다. 특히 DSI는 물리적 시료 없이도 경제적 가치와 과학적 결과를 창출할 수 있어, 기존의 유전자원 관리 체계와 전혀 다른 방식의 거버넌스를 요구한다. 이에 따라 다자체계의 설계와 운영에 있어서는 투명성과 신뢰, 그리고 기술중립적 접근이 핵심 이 되어야 한다. 기술혁신국가로서 한국은 DSI를 단순한 연구결과가 아닌 국가 전략자산으로 인식하고, 다음과 같은 대응 전략을 수립할 필요가 있다.

첫째, DSI 기반 산업의 확장을 고려한 국가 차원의 생명정보 프레임워크 구축이 시급하다. 이를 통해 공공 데이터의 품질관리, 추적 시스템, 민간 활용 활성화를 모두 포괄할 수 있어야 한다. 

둘째, KOBIC, 바이오파운드리, 유전자합성 플랫폼 등 국가 주요 생명정보 인프라 간의 유기적 연계를 통해 ‘디지털 바이오 주권’을 확보해야 한다. 

셋째, DSI 활용에 대한 국내외 정책 조율을 전담하는 범부처 협의체 또는 전담기구의 설립이 필요하다. 이를 통해 다자체계 협상 참여와 국내 대응을 동시에 추진할 수 있다.

넷째, 기술이전, AI 기반 분석, 사회공헌형 모델 등을 포함하는 복합적 이익공유 수단을 제안하여 국제무대에서의 실질적 협상력을 확보해야 한다. 이러한 전략은 단지 대응 차원을 넘어, 국제 DSI 거버넌스를 주도하고, 미래 생명정보 질서를 설계하는 과정에서 한국이 중심국가로 부상하는 데 기여할 수 있다.

우리는 지금, 생명현상을 정보로 이해하고, 설계하고, 재현할 수 있는 전환기의 한복판에 있다. 합성생물학은 이 가능성을 실현하는 기술이고, AI는 그 속도를 가속화하는 동력이다. DSI는 데이터임과 동시에 자산이며, 공공성과 상업성을 동시에 지닌 전략적 자원이다. 따라서 이 자원의 활용과 공유에 대한 정책은 기술혁신을 촉진하면서도, 공정성과 포용성을 담보해야 한다. 연구자들이 자유롭게 DSI에 접근하고, 이를 바탕으로 새로운 생명 시스템을 설계할 수 있도록 하는 환경이야말로 진정한 의미의 이익공유이자 바이오안전성의 출발점이 될 것이다.


대전광역시 유성구 과학로 125 한국생명공학연구원 바이오안전성정보센터

TEL 042-879-8318   |   FAX 042-879-8309

COPYRIGHT(C) 2022 BY KBCH. ALL RIGHTS RESERVED