마크다운·HTML·코드 블록 글자수세기 정확 계산법 2026
마크다운·HTML·코드 블록 글자수세기 정확 계산법 2026
2026년 4월 2일
블로그·깃허브·개발 문서 작성 시 마크다운 문법, HTML 태그, 코드 블록이 포함되면 글자수 계산이 복잡해진다. 도구마다 태그를 제외하는지 포함하는지 다르므로 정확한 기준이 필수다.
마크다운 요소별 글자수 처리
| 마크다운 요소 | 코드 | 렌더링 결과 | 글자수 계산 |
|---|---|---|---|
| 제목 | # 제목 | 제목 | 태그 제외(2자) vs 포함(6자) |
| 굵은체 | **강조** | 강조 | 텍스트만(2자) vs 전체(8자) |
| 링크 | [텍스트](url) | 텍스트 | 텍스트만(2자) vs 전체(20자+) |
| 이미지 |  | alt | alt만(3자) vs 전체 |
| 코드 | `code` | code | 내용만(4자) vs 백틱 포함(6자) |
| 목록 | - 항목 | 항목 | 기호 제외 vs 포함 |
HTML 태그 처리 기준
- 순수 텍스트 기준: 태그 완전 제외, 표시되는 텍스트만 계산. "근사 렌더링"이라 불림.
- 마크업 포함 기준: 모든 태그와 속성을 포함. "원본 코드" 기준.
- 하이브리드 기준: 의미 있는 마크업(
,
)은 포함, 스타일 태그()는 제외 (드문 경우).
예시 비교:
- 원본:
<p>안녕하세요 <strong>반갑습니다</strong></p> - 순수 텍스트 기준: "안녕하세요 반갑습니다" = 11자(공백 포함).
- 마크업 포함: <p>안녕하세요 <strong>반갑습니다</strong></p> = 약 47자.
코드 블록 처리
- 포함: 백틱 또는 들여쓰기 코드를 일반 텍스트로 계산.
- 제외: 코드 블록 자체를 글자수 계산에서 빼기.
- 부분 포함: 코드는 제외, 코드 주석만 포함 (매우 드문 경우).
예시:
- 코드 포함: ```python def hello(): pass``` 모두 계산 = 약 30자.
- 코드 제외: 코드 블록 전체 무시 = 0자 추가.
도구별 마크다운·HTML 처리 비교
| 도구 | 마크다운 태그 | HTML 태그 | 코드 블록 | 신뢰도 |
|---|---|---|---|---|
| TextKit | 제외 | 제외 | 제외 | ⭐⭐⭐⭐⭐ |
| MS 워드 | N/A | 제외(복사 시) | 포함 | ⭐⭐⭐⭐ |
| 구글 Docs | N/A | 자동 변환 | 포함 | ⭐⭐⭐⭐ |
| Medium | 자동 변환 | 일부 제외 | 포함 | ⭐⭐⭐ |
| GitHub | 표시 안 함 | 렌더링 기준 | 표시 | ⭐⭐⭐⭐ |
| 온라인 계산기 | 불명확 | 불명확 | 불명확 | ⭐⭐ |
마크다운 유형별 정확 계산
- 헤더 (#, ##, ###): 텍스트만 계산. "## 제목"이면 "제목"만 2자 (기호 제외).
- 강조 (**, __, *, _): 텍스트만 계산. "**bold**"면 "bold" 4자.
- 인라인 코드 (`): 내용만 계산. "`const`"면 5자 (백틱 제외).
- 링크 ([텍스트](URL)): 텍스트만 계산. "[클릭](https://example.com)"이면 "클릭" 2자.
- 이미지 (): alt 텍스트만. ""면 4자.
- 코드 블록 (```language ... ```): 제외 권장 (또는 내용만 계산).
- 목록 (-, *, +): 텍스트만. "- 항목"이면 "항목" 2자.
- 인용 (>): 텍스트만. "> 인용"이면 "인용" 2자.
깃허브·블로그 글자수 확인 방법
- GitHub README: 마크다운 원본을 TextKit에 복사 → 태그 제외한 순수 글자수 확인.
- Medium/Dev.to: 원본 마크다운 또는 HTML 원본 보기 → TextKit으로 분석.
- 개인 블로그 (WordPress/Tistory): HTML 편집 모드 원본 → TextKit 복사 분석.
- Notion/Obsidian: 마크다운 내보내기 → TextKit 분석.
실제 계산 사례
마크다운 원본 (GitHub 블로그 포스트):
# 글자수세기 가이드마크다운으로 작성한 블로그 글입니다.
- 항목1: 텍스트
- 항목2: 코드
example
def count_chars():
return "hello world"
결론입니다.
| 계산 방식 | 결과 | 설명 |
|---|---|---|
| 순수 텍스트 | 약 48자 | 마크다운 기호 모두 제외, 코드 블록 제외 |
| 마크다운 포함 | 약 110자 | 마크다운 기호 포함 |
| 코드 블록 포함 | 약 150자 | 코드 블록까지 모두 포함 |
결론: 맥락에 따라 48자~150자로 3배 이상 차이 발생. 목적 명확화 필수.
사용 맥락별 추천 계산 방식
- 블로그 SEO 글자수 제한: 순수 텍스트 기준 (코드·이미지 alt 제외). TextKit 기준.
- 원고료 계산: 계약 명시 필수 (보통 순수 텍스트 기준).
- GitHub README 길이 판단: 렌더링 결과 기준 (순수 텍스트).
- 학술 논문 (코드 포함): 규정 확인 (일반적으로 순수 텍스트).
- SNS 공유 (링크 포함): SNS 기준 (URL 단축 처리 필수).
📝 실제 사용 경험 1: GitHub 프로젝트 README 글자수
마크다운 원본으로 5,000자라고 생각했으나 TextKit으로 확인하니 순수 텍스트 기준 2,800자였다. 코드 블록과 기호를 제외한 실제 콘텐츠는 원본의 56%에 불과했다. 이후 README 작성 시 실제 가독 글자수를 기준으로 계획했다.
📝 실제 사용 경험 2: 개발 블로그 원고료 분쟁
HTML 편집 모드에서 4,500자라고 제시했는데, 발주처는 코드 블록(1,200자)을 제외해 3,300자로 계산했다. 계약서에 "마크다운·HTML 태그·코드 블록 제외, 순수 텍스트 기준" 명시 후 재계산해 분쟁을 해결했다.
자주 묻는 질문
- Q. 마크다운 링크 [텍스트](URL) 글자수는? A. 텍스트만 계산 (일반적). "[링크](https://very-long-url.com)"면 2자, URL 포함 시 20+ 자.
- Q. 코드 블록은 포함해야 하나? A. 맥락 의존. SEO·원고료는 제외 권장, 기술 문서 분석은 포함도 가능.
- Q. GitHub README 1만 자라고 하면 순수 텍스트? A. 확인 필수. 보통 렌더링 기준(코드 제외)이지만, 발표자 의도 확인 필수.
- Q. Notion에서 내보낸 마크다운 글자수는? A. TextKit에 복사 → 순수 텍스트 글자수 확인. Notion 자체 카운트와 다를 수 있음.
- Q. HTML 복사해서 TextKit 붙여넣기하면 정확한가? A. 대부분 정확 (태그 제외). 단, 특수 인코딩(
, )은 확인 권장.
마크다운 글자수 검증 체크리스트
- ✅ 원본 마크다운/HTML 복사.
- ✅ TextKit에 붙여넣기 → 순수 글자수 확인.
- ✅ 코드 블록 포함 여부 결정.
- ✅ 링크·이미지 alt 텍스트 기준 명확화.
- ✅ 발주처·플랫폼 규정과 비교.
- ✅ 불일치 시 기준 합의.
댓글
댓글 쓰기