Markdown Is All You Need — 마크다운이라는 선택이 바꾸는 것들
"대표님께서 2년 전부터 강조하시던 '나만의 맥락정보'... 이제서야 비로소 깨닫게 되었습니다."
더배러 커뮤니티에서 오래 함께한 교수님의 메시지였다. 옵시디언을 8~9개월 써보고 나서야 이해한 것이라고 했다. 읽다가 멈췄다. 한 번 더 읽었다. 단순한 기쁨이라기보다는 안도에 가까운 감정이었다. 누군가가 같은 풍경에 도착했다는 감각.
나는 2년 전부터 마크다운과 PKM, 그리고 "나만의 맥락정보"를 이야기하고 다녔다. 강의에서, 워크숍에서, 유튜브에서, 커뮤니티에서. 반응은 대부분 비슷했다. "마크다운이 뭐가 좋은 건지 모르겠어요." "노션이면 충분하지 않나요?" "저는 그냥 ChatGPT에 물어보면 되는데요."
틀린 말이 아니었다. 당장 눈앞에 보이지 않는 것을 설명하는 건 원래 어렵다.
그래도 계속 말했다. 이것이 중요하다고. 지금은 몰라도 반드시 알게 될 거라고.
이 글은 그 이야기의 전부를 담은 것이다.
죽은 파일, 살아있는 파일
10년 전에 쓴 파일을 열어본 적이 있는가.
나는 얼마 전에 시도했다. 대학원 과정 때 정리해둔 연구 노트였다. 주제는 지금 이야기하는 강의 주제와 연구와도 맞닿아 있어서 "이거다" 싶었다. 밤새 정리했던 이론 프레임워크, 지도교수와 나눈 논의 메모, 직접 설계한 설문 초안까지 전부 그 안에 있었다.
문제는 파일 포맷이었다.
어떤 파일들은 현재 맥북에서는 열리지 않았다. 한컴오피스 뷰어를 깔아봤지만 서식이 깨졌다. 웹 변환기를 돌려봤더니 표는 사라지고 들여쓰기는 뭉개졌다. 파일은 존재했다. 하지만 지식은 이미 죽어 있었다.
우리는 보통 지식의 수명을 "내용"으로 판단한다. 이 이론이 아직 유효한가, 이 데이터가 최신인가. 하지만 진짜 위협은 내용이 아니라 그릇에서 온다. .hwp, .ppt, .doc — 이 포맷들은 특정 소프트웨어가 있어야만 열린다. 소프트웨어가 업데이트되면 옛 포맷은 버려진다. 그 안에 담긴 내용이 아무리 훌륭해도, 그릇이 깨지면 꺼낼 수가 없다. 그래도 이 형식을 써야한다면 hwpx, pptx, docx 포맷을 권장한다.
스미소니언 기관은 디지털 보존 가이드에서 plain text를 최고 등급 보존 포맷으로 분류한다. 이유는 단순하다. 특정 소프트웨어에 의존하지 않기 때문이다. 1970년대에 작성된 .txt 파일은 2026년 오늘도 아무 도구에서나 열린다.
반면 10년 전 .hwp는 이미 접근 불가능하다. 2000년대 초반, 한국에서 가장 많이 쓰던 워드프로세서 중 하나가 "훈민정음"이었다. 지금 .gul 파일을 열 수 있는 사람이 있는가.
지식의 수명은 내용이 아니라 그릇이 결정한다.
# 하나가 세우는 뼈대
그렇다면 살아있는 그릇은 무엇인가. 그 답이 마크다운이다.
메모장을 열어 글을 쓰다가, 문득 제목 앞에 #을 쳐본 적이 있는가? 메모장에서는 아무 일도 일어나지 않는다. 하지만 Obsidian이나 VS Code에서 같은 행위를 하면, 글자 크기가 커지고, 목차가 생기고, 접을 수 있는 섹션이 만들어진다. 평면에 불과했던 텍스트에 갑자기 건축물의 뼈대가 들어선다.
2004년, 존 그루버라는 블로거가 이것을 세상에 내놓았다. 목표는 단 하나 — "렌더링하지 않아도 사람이 읽을 수 있는 글을 쓰자." 그는 태그를 없애는 대신, 사람이 이미 습관적으로 쓰는 기호 — #, *, - — 에 구조적 의미를 부여했다. 이메일에서 이미 쓰고 있던 관습을 공식화한 것이다.
#은 글자 크기를 키우는 명령어가 아니다. 사고의 위계를 선언하는 행위다. # 대주제 아래에 ## 중주제를 쓰고, 그 아래에 ### 소주제를 넣는 순간, 당신은 글을 쓰는 게 아니라 생각을 구조화하고 있다. 볼드(**텍스트**)는 "이건 놓치면 안 된다"는 판단의 기록이다. 리스트(-)는 "이 항목들은 동등한 무게를 가진다"는 선언이다. 코드블록(```)은 "이건 실행 가능한 지식이다"라는 구분이고, 인용(>)은 "이건 내 말이 아니라 남의 말이다"라는 경계다.
마크다운은 문법이 아니다. 생각의 운영체제다.
그리고 본질적으로 plain text이기 때문에, 50년이 지나도 깨지지 않는다. 살아있는 그릇 위에 사고의 뼈대까지 세운다. 이것이 # 하나가 바꾸는 것이다. 놀랍게도 최근 국가인공지능전략위원회에서도 공공 문서 작성 표준을 마크다운으로 채택했다.
세 줄의 하이픈이 여는 세계
마크다운이 사고의 뼈대를 세운다면, 다음 질문은 이것이다. 10,000개의 노트에서 "지난달 완료한 AI 관련 프로젝트"를 어떻게 찾을 것인가?
파일명을 하나씩 열어볼 수는 있다. 전문 검색으로 "AI"를 쳐볼 수도 있다. 수백 개가 뜬다. 그중에서 "프로젝트"인 것만, 그중에서 "지난달 완료된" 것만 골라내려면? 문서가 자기 자신에 대해 아무것도 말해주지 않기 때문에 생기는 문제다.
해결책은 놀라울 만큼 단순하다. 문서 맨 위에 --- 세 개를 쓰고, 그 사이에 몇 줄을 채우면 된다. YAML frontmatter다. 문서의 본문이 시작되기 전에, 이 문서가 "무엇인지"를 기계가 읽을 수 있는 형식으로 선언하는 영역이다.
이것이 들어가면 마크다운 문서는 두 개의 층을 갖는다. 위쪽은 기계가 읽는 인덱스, 아래쪽은 사람이 읽는 서사. 도서관의 색인 카드와 책 본문이 한 몸에 붙어 있는 형태다. 사서는 색인 카드만 보고 원하는 책을 찾고, 독자는 색인 카드를 무시하고 바로 본문을 읽는다. 두 사용자가 같은 물리적 객체를 완전히 다른 방식으로 사용한다.
이 이중 구조가 게임체인저다. 글을 쓰는 행위 자체가 데이터를 쌓는 행위가 된다. 추가적인 정리 작업이 아니라, 글쓰기의 자연스러운 부산물로 검색 가능한 지식 베이스가 만들어진다. 노트를 쓸 때 30초를 더 투자해서 frontmatter를 채운다. 그 30초가 나중에 수십 분의 검색 시간을 없앤다. 그리고 그 노트가 100개, 1,000개, 5,000개, 10,000개로 쌓이면, 30초씩 투자한 메타데이터가 전혀 다른 차원의 시스템을 만들어낸다.
(다만 YAML에는 함정이 있다. 가장 유명한 것이 "노르웨이 문제(Norway Problem)"인데, NO라는 값을 쓰면 노르웨이 국가 코드(NO)가 아니라 불리언 false로 해석된다. 단순함이 곧 안전을 의미하지는 않는다.)
--- — 이 세 줄의 하이픈은 그냥 구분선이 아니다. 문서와 데이터베이스 사이의 경계선이다. 이 선 위에는 기계의 언어가, 이 선 아래에는 사람의 언어가 있다.
AI가 같은 언어를 쓰게 되었다
여기까지가 인간 쪽의 이야기다. 이제 기계 쪽으로 가보자.
ChatGPT에게 질문을 하나 던져보라. 답변을 자세히 들여다보라. 볼드, 리스트, 헤딩... 마크다운이다. Claude에게 물어봐도, Gemini에게 물어봐도 마찬가지다. OpenAI, Anthropic, Google — 서로 치열하게 경쟁하는 세 회사가 한 가지에는 이견이 없다. 출력 포맷이다. 전부 마크다운으로 답한다. 누가 시킨 것도, 국제 표준으로 정한 것도 아닌데 말이다.
이유는 세 겹이다.
첫째, 학습 데이터. LLM은 GitHub의 수억 개 README.md, Stack Overflow의 답변, 기술 문서를 먹고 자랐다. 인간이 마크다운으로 기록했고, 기계가 그것을 배웠고, 다시 마크다운으로 말하기 시작했다.
둘째, 토큰 경제. "프로젝트 관리의 3가지 원칙"을 마크다운으로 쓰면 약 45토큰이면 된다. 같은 내용을 JSON으로 구조화하면 약 85토큰, XML이라면 약 110토큰이 든다. 같은 이야기를 하는데 비용이 2~3배 차이 난다. AI가 마크다운으로 말하는 것은 미학적 선택이 아니라 경제적 최적화다.
셋째, 구조적 정합성. #은 대주제, ##은 소주제, -는 나열, **는 강조. 이 단순한 기호 체계가 LLM의 사고 방식과 정확히 맞물린다. RAG(검색 증강 생성) 시스템에서는 마크다운의 헤딩이 자연스러운 분할 경계가 되어 검색 정확도를 높인다. 많은 RAG 파이프라인이 PDF를 먼저 마크다운으로 변환한 뒤 처리하는 이유가 여기에 있다.
내가 제안하는 EFLM(Extended Format Layer Model) 프레임워크에서 마크다운은 독특한 위치를 점한다. Layer 2(인간이 쓰는 층)와 Layer 4(AI가 소통하는 층)를 동시에 점유하는 유일한 포맷이다. EFLM에 대해서는 별도 강의에서 다루도록 하겠다. 존 그루버가 2004년에 마크다운을 만들 때, 20년 뒤 AI가 이 포맷으로 대화할 것이라고는 상상도 하지 못했을 것이다. Layer 4는 설계된 것이 아니라 창발한 것이다.
인간과 기계가 같은 언어를 쓴다는 것 — 기술사에서 이것은 꽤 드문 일이다.
나만의 확률값
여기서 결정적인 전환이 일어난다. 마크다운이 인간과 AI의 공용어라면, 그 공용어로 무엇을 기록하느냐가 승부를 가른다.
언어모델의 본질은 확률 분포다. "지식관리"라는 단어를 입력했을 때, 일반적인 AI는 다음에 올 단어로 "지식경영"을 0.7의 확률로 예측한다. 드러커, 노나카, 암묵지와 형식지. 인터넷 전체의 평균이 그렇기 때문이다.
하지만 내 기록을 먹인 AI에게 같은 질문을 던지면, 전혀 다른 풍경이 펼쳐진다. 옵시디언이 나온다. 마크다운과 제텔카스텐이 나온다. 빌 에반스와 리처드 파인만이 나온다. 일반 모델에서 Obsidian이 나올 확률은 10%에 불과하지만, 나의 컨텍스트가 반영된 모델에서는 80%로 뛴다.
이 확률의 차이가 곧 개인화다. 그리고 이 개인화는 하늘에서 떨어지지 않는다. 기록에서 온다.
사피어-워프 가설(Sapir-Whorf Hypothesis)이라는 것이 있다. 우리가 사용하는 언어가 사고를 규정한다는 가설이다. 이것을 AI에 대입하면 이렇게 된다. 우리가 기록하는 텍스트가 AI의 사고를 규정한다. [[위키링크]]로 연결한 개념들은 AI에게 뉴런의 시냅스처럼 작동한다. # 제목으로 세운 위계는 AI가 정보를 탐색하는 지도가 된다. tags:로 분류한 범주는 AI가 맥락을 파악하는 좌표가 된다.
그래서 PKM의 본질이 여기서 드러난다. PKM은 단순한 메모 저장소가 아니다. 나만의 확률값을 훈련시키는 데이터셋이다. 그리고 그 데이터셋은 마크다운으로 기록될 때 비로소 AI가 읽을 수 있는 형태가 된다.
나의 워크플로우를 공개한다. STT로 걸으면서 떠오르는 생각을 날것 그대로 쏟아낸다. 축적된 기록에서 반복적으로 등장하는 개념, 자주 연결되는 아이디어를 파악한다. 그것을 Claude Code 스킬에 반영해 나의 문체와 사고 체계를 담은 글을 생성한다. 핵심은 마지막 단계가 아니라 첫 번째 단계다. 인풋이 빈약하면 아웃풋도 빈약하다.
성문화되지 않은 나만의 지식은 AI에게 존재하지 않는 것과 같다. "차돌짬뽕"이 침착맨 채널의 철면수심을 의미한다는 것을, 빌 에반스의 즉흥연주와 니클라스 루만의 제텔카스텐을 같은 선상에 놓는 이유를 — 기록하지 않으면 그 연결은 나와 함께 사라진다.
바이올린만으로 교향곡은 연주할 수 없다
"마크다운이 그렇게 좋으면 다 마크다운으로 하면 되지 않나?"
이 시리즈를 쓰면서 가장 많이 받은 질문이다. 솔직히 말하면, 나도 한때 그렇게 생각했다. 그러다 현실에 부딪혔다. 대학 행정실은 .hwpx를 요구했다. 기업 컨설팅 보고서는 .pptx가 아니면 받지 않았다. 학술지 투고에는 PDF가 필수였다.
마크다운으로 쓸 수는 있다. 하지만 마크다운으로 전달할 수는 없는 세상이 여전히 존재한다. 그렇다고 마크다운이 부족한 것은 아니다. 질문 자체가 틀렸다. 바이올린이 아무리 훌륭해도 팀파니의 울림을 대체하지는 못한다. 포맷도 마찬가지다. 문제는 대체가 아니라 분업이다.
EFLM 모델의 전체 그림이 여기서 열린다. 6개의 층이 각자의 역할을 맡는다. L1(보존)의 plain text가 시간을 이기고, L2(저작)의 마크다운이 사고의 뼈대를 세우고, L3(메타데이터)의 YAML이 문서를 분류하고, L4(AI 인터페이스)에서 마크다운이 인간과 AI의 공용어로 작동하고, L5(기계 교환)의 JSON과 XML이 시스템 간 정확한 데이터를 전달하고, L6(전달)의 HTML, PDF, DOCX, PPTX가 최종 소비자에게 닿는다.
핵심 원칙은 이것이다. 한 번 쓰고, 여러 형태로 내보낸다. 강의 자료를 마크다운으로 쓴다. YAML frontmatter로 메타데이터를 붙인다. 이 하나의 원본에서 학생용 PDF, 행정실용 HWPX, 웹사이트용 HTML, AI Q&A 시스템의 입력 데이터가 나온다. 내용을 네 번 쓰는 것이 아니다. 한 번 쓰고 네 번 변환하는 것이다.
마크다운은 "모든 포맷을 대체하는 포맷"이 아니라, "모든 포맷이 시작되는 포맷"이다.
같은 곳을 바라보는 사람들
다시 친한 교수님의 메시지로 돌아간다. 그 안에 이런 대목이 있었다.
"가끔은 대표님 가시는 길 주변에 앞뒤 주변에 아무도 없어 보이고 이 길이 맞나 싶을 때가 있으시다면, 저를 포함해서 많은 분들이 뒤에서 같은 곳을 바라보고 나름대로의 속도와 맥락으로 같이 따라가며, 주변에서 응원하는 사람들이 생각보다 꽤 많다는 것을 항상 기억해주셨으면 좋겠습니다."
읽는데 목이 메었다.
솔직히, 가끔은 이 길이 맞나 싶을 때가 있었다. 내가 너무 앞서 가는 건 아닌가. 아니, 혹시 방향 자체가 틀린 건 아닌가. 주변을 돌아보면 같은 이야기를 하는 사람이 보이지 않았다. 앞에도, 옆에도, 뒤에도.
그런데 뒤에서 걷고 있는 사람들이 있었다. 보이지 않았을 뿐이다. 앞만 보고 걸었기 때문에 뒤를 돌아볼 여유가 없었고, 같은 속도가 아니었기 때문에 옆에 있는지 몰랐다.
깨달음에는 시간이 필요하다. 교수님은 8~9개월 동안 노트를 쓰고, 링크를 걸고, 태그를 달았다. 처음에는 "이게 뭐가 다르지?"라고 느꼈을 수도 있다. 그러다 어느 순간, 과거에 기록한 노트가 예상치 못한 맥락에서 떠올랐을 것이다. 검색하지 않았는데 연결이 보이고, 의도하지 않았는데 패턴이 드러나는 경험. 그때 비로소 "아, 이것이 나만의 맥락정보구나"라는 것을 몸으로 알게 된다.
그리고 이제 자신도 학생들과 교수님들께 같은 이야기를 하고 다닌다고 했다. 2년 전 내가 했던 말을, 2년 뒤 다른 사람이 자신의 언어로 다시 하고 있다. 혁신은 한 사람이 전파하는 것이 아니다. 깨달은 사람이 다시 전파자가 되는 순환이다.
"Markdown Is All You Need"의 진짜 의미
이 글의 제목을 다시 보자. "Markdown Is All You Need."
이것은 "마크다운만 쓰면 된다"는 뜻이 아니다.
plain text가 지식을 살려두고, #이 사고의 뼈대를 세우고, ---가 문서를 데이터베이스로 바꾸고, AI가 같은 언어를 쓰게 되고, 나만의 확률값이 쌓이고, 포맷 생태계가 분업하고, 같은 곳을 바라보는 사람들이 함께 걷는다 — 이 모든 것이 하나의 선택에서 시작된다는 뜻이다.
마크다운이라는 선택.
그것은 포맷을 고르는 행위가 아니다. 지식을 살아있게 유지하겠다는 선언이고, 흩어진 생각에 구조를 부여하겠다는 결심이며, AI 시대에 인터넷 평균이 아닌 나만의 확률값을 갖겠다는 의지다. 사소해 보이는 기술적 선택 하나가 삶과 사고 방식 전체를 바꾼다.
당신은 어떤가?
당신의 파일은 10년 뒤에도 살아 있을 수 있는가. 당신의 AI는 당신처럼 사고하는가. 당신만의 확률값을 가지고 있는가. 아니면 인터넷 평균의 확률을 그대로 반영하고 있는가.
기록하라. 연결하라. 마크다운으로.
그리고 만약 지금 이 길이 맞나 싶다면, 기억하라. 뒤에서 같은 곳을 바라보며, 나름대로의 속도와 맥락으로 함께 걷고 있는 사람들이 생각보다 꽤 많다는 것을.
중요한 건 도착 시점이 아니라 방향이다.
혹 마크다운 사용하기를 시작하려 한다면 옵시디언을 추천한다. 관련해서 언제든 구요한을 맨션(@)하고 질문하시기를. 질문은 언제나 환영이다. 책을 구매해서 공부하고 싶다면 이번에 출간된 옵시디언 프로페셔널 노트(구요한 저)를 사랑해주시기를.
—🌌 지식을 연결하고 지휘하는 새로운 경험, 커맨드스페이스— |