L. Vannella, E. Lahner, J. Osborn, B. Annibale
Aliment Pharmacol Ther. 2013 Feb;37(4):375-82. doi: 10.1111/apt.12177.
INTRODUCTION
악성빈혈(Pernicious anaemia, PA)은 Biermer병으로도 알려져 있으며, 위 체부 점막의 위축성 손상을 특징으로 하는 자가면역 질환으로 간주됩니다. 이로 인해 정상적으로 음식물에서 흡수된 비타민 B12와 강하게 결합하여 회장의 점막 벽을 통해 운반하는 단백질인 내인자의 생성에 관여하는 벽세포가 손실됩니다. 내인자 부족은 비타민 B12 결핍과 그로 인한 거대적아구성 빈혈 발생의 병태생리학적 기전이며, 이는 PA의 가장 흔한 임상 증상입니다. 임상적으로 PA는 서서히 나타날 수 있으며 다양한 양상으로 표현됩니다. 일반적으로 증상은 서서히 나타나며 빈혈과 관련이 있거나, 말초 신경병증 또는 더 심각한 신경학적 합병증 등과 관련이 있을 수 있습니다.
더 나아가, PA 환자들은 위암(Gastric Cancer, GC)과 같은 장기적인 합병증을 겪을 수 있습니다. PA 환자에서 위암 발생 위험은 문헌에 보고되어 있으나, 연구마다 대상자 수나 추적관찰 기간 동안 위암을 확인하는 방법이 달라 그 결과가 서로 상이합니다. PA 환자에서 흔히 보이는 날문(유문)부는 보존되고 체부에 국한된 위축성 위염은 Correa가 제시한 위암 전구 병변 경로에는 포함되지 않습니다. 반면, 위점막의 더 광범위한 위축(다병소성 위축성 위염)은 위 신생물 병변으로의 진행 위험 증가와 연관되어 있는 것으로 보입니다.
또한 PA의 임상적 발현은 수년간 존재했을 가능성이 있는 위축성 위염의 자연 경과에서 마지막 단계일 수 있다고 보고된 바 있습니다. 위와 같은 점을 고려할 때, PA 환자와 위축성 위염 환자에 대해 서로 다른 임상적 관리를 적용하는 것은 타당하지 않아 보입니다. 최근, 위의 전암성 병변 및 병태에 대한 관리를 위한 전문가 위원회가 권고안을 발표하였으나, 그 지침은 PA와 같은 전암성 병태에는 적용되지 않는다고 명시하였습니다. 반면, 영국 소화기학회 및 외과종양학회에서 제시한 위암 관리 지침에서는 PA가 전암성 병태로 간주될 수 있으며 내시경 추적관찰의 고려 대상이 될 수 있다고 언급되었지만, 구체적인 지침은 여전히 부족합니다.
따라서 PA 환자의 관리에 대해서는 논란이 지속되고 있으며, 이들에서의 위암 발생 위험의 정도는 아직 명확히 규명되지 않았습니다. 이에 우리는 PA와 위암 발생에 관한 기존 문헌을 고찰하고, PA 환자에서의 위암 발생률을 추정하고자 하였습니다.
MATERIALS AND METHODS
Literature search strategy
본 리뷰는 PubMed에서 체계적인 전산 검색을 통해 확인된 악성빈혈(PA)에 관한 연구들의 발표된 결과를 기반으로 하였습니다. PubMed 데이터베이스는 2011년 9월 15일까지 발표된 논문들을 대상으로 검색되었습니다. PubMed에 대한 전체 검색 전략은 부록(Table S1)에 포함되어 있으며, 다음과 같은 검색 용어들을 포함하였다: 악성빈혈(pernicious anaemia), 위축성 위염(atrophic gastritis), A형 위염(Type A gastritis), 거대적아구성 빈혈(macrocytic anaemia), 코발라민 결핍(cobalamin deficiency), 비타민 B12 결핍(vitamin B12 deficiency), 내인성 인자 결핍(intrinsic factor deficiency), 자가면역성 위염(autoimmune gastritis), 위암(stomach cancer), 위암(gastric cancer), 위선암(gastric adenocarcinoma), 위신생물(gastric neoplas*), 위암종(gastric carcinoma), 위종양(gastric tumour). 본 검색은 PRISMA 지침에 따라 수행되었습니다. 또한 포함된 연구들의 참고문헌 목록도 함께 검색하였습니다.
Study selection
포함 및 제외 기준
다음의 모든 기준을 충족하는 연구는 본 체계적 문헌고찰에 포함하였습니다:
(i) PA(악성빈혈) 환자를 대상으로 하며, 명확한 추적 관찰 기간 동안 위암(GC) 발생 건수를 보고한 관찰연구일 것,
(ii) 성인 환자를 대상으로 한 연구일 것,
(iii) 고유한 데이터를 제시한 원본 논문일 것.
연구 시기에 대한 제한은 두지 않았습니다.
다음의 경우에는 연구에서 제외하였습니다:
(i) 리뷰, 편지, 사설, 증례보고 등 원본 논문이 아닌 경우,
(ii) 추적 관찰 데이터가 제공되지 않은 경우,
(iii) 영어, 스페인어, 이탈리아어, 독일어, 프랑스어 이외의 언어로 작성된 경우.
선정 과정
연구의 선정은 두 명의 연구자(LV와 EL)가 제목과 초록을 바탕으로 독립적으로 수행하였습니다. 판단이 어려운 경우에는 원문 전체를 검토하였습니다. 의견이 일치하지 않는 경우에는 제3의 연구자(BA)와의 논의를 통해 조율하였습니다.
Data extraction
두 명의 연구자(LV와 EL)가 각 논문으로부터 다음의 정보를 독립적으로 추출하였습니다: 제1저자의 성, 발표 연도, 연구가 수행된 국가, 연구 설계, PA 진단 기준, 연구 대상자 선정 방법, 조사된 환자 수, 추적 관찰 기간(년), 인년(person-years) 계산 여부, 환자의 연령(중앙값, 평균 또는 범위), 성별, 추적 관찰 방식(능동적 여부), 추적 관찰 방법, 위암(GC) 확인 방법, 병리소견, 위암 발생 건수.
Quality assessment
두 명의 연구자(LV와 EL)는 포함된 모든 연구의 질을 Newcastle-Ottawa 평가 척도(Newcastle-Ottawa Quality Assessment Scale)를 사용하여 평가하였습니다. 이 척도는 코호트 연구를 대상으로 하며, 각 연구에 최대 9점(별)을 부여할 수 있습니다. 평가 항목은 세 가지 범주로 구성되며, 각각은 다음과 같습니다:
Selection과 Outcome Assessment 항목에서는 각 항목당 최대 1점, Comparability 항목에서는 최대 2점을 받을 수 있습니다.
본 연구에서는 임의적으로 연구의 질을 다음과 같이 분류하였습니다:
9점을 받은 연구: 고품질(high quality),
7~8점: 중간 품질(medium quality),
5~6점: 저품질(low quality),
4점 이하: 매우 낮은 품질(very low quality).
평가 결과에 차이가 있을 경우, 두 명의 연구자(LV와 EL)가 논의를 통해 조율하였습니다.

Outcome
관심 있는 결과 지표는 위암(GC)의 발생률이었으며, 이는 추적 관찰 기간 동안 새롭게 진단된 위암의 수를 인년(person-years)으로 나누어 계산하였습니다.
Statistical analysis
각 포함된 연구로부터, 위암(GC) 발생 건수와 위험 노출 인년(person-years)을 추출하였습니다. 연구에서 명확하게 제시되지 않은 경우에는 검토자들이 인년당 발생률을 직접 계산하였습니다. 통계적 이질성은 카이제곱(Chi-squared) 검정을 통해 평가하였으며, 적절한 경우에는 Mann–Whitney 검정을 사용하였습니다. P값이 0.05 미만인 경우를 통계적으로 유의한 것으로 간주하였습니다.
인년당 위암 발생률의 통합 비율과 95% 신뢰구간을 계산하였습니다. PA(악성빈혈) 환자에서 전체 위암 상대위험도(relative risk, RR)를 추정하기 위해, 선택된 연구들 중 내시경 및 조직검사를 기반으로 한 능동적 추적 관찰을 통해 위암이 진단된 연구들에서 PA 환자의 연간 위암 발생률을 계산하였습니다. 이 위암 발생률은 메타분석에 사용되었고, GLOBOCAN 웹사이트에서 제공하는 유럽 각국의 40세 이상 일반 인구(남녀 모두)의 연간 위암 발생률과 비교하여, PA 환자에서 위암 발생 위험도를 산출하였습니다. 이때 연간 발생률은 일정하다는 가정하에 계산되었습니다. 통계 분석은 전용 소프트웨어(MedCalc Software, 버전 11.3; 벨기에 마리아케르케)를 사용하여 수행하였습니다.
RESULTS
Search results
전자 검색 전략을 통해 PubMed에서 총 15,387건의 기록이 확인되었으며, 이 중 중복을 제거한 고유 문헌은 2,760건이었습니다(Figure 1). 이들 문헌은 제목과 초록을 기준으로 선별하였으며, 포함 및 제외 기준을 적용한 후 71편의 논문을 원문 평가 대상으로 선정하였습니다. 이 중 71편의 원문 논문 중 27편이 최종적으로 적합 기준을 충족하여 자료 추출에 포함되었습니다.¹²⁻³⁸

Quality assessment
포함된 연구들의 전반적인 질 평가는 Table S2에 제시되어 있습니다. 고품질로 평가된 연구는 7편, 중간 품질은 6편, 저품질은 10편, 매우 낮은 품질은 4편이었습니다. 고품질로 분류된 7편 중 4편의 연구¹⁹, ²⁵, ²⁸, ²⁹는 미국 및 북유럽 지역의 지역사회를 대표하며, 대규모 표본을 보고한 연구였습니다.
반면, 저품질 및 매우 낮은 품질로 평가된 연구들의 대부분은 일치시킨 코호트 연구(matched cohort study)가 아니었고, 이로 인해 Newcastle-Ottawa 평가 척도의 "비교 가능성(Comparability)" 항목을 평가할 수 없었습니다.¹², ¹³, ¹⁶–¹⁸, ²⁰–²⁴, ³¹, ³⁴, ³⁷, ³⁸
Characteristics of included studies
포함된 연구들의 특성은 Table S3에 요약되어 있습니다. 여성의 비율이 높은 연구는 14편으로, 여성 비율은 55.3%에서 81.2% 사이였고, 4편의 연구에서는 여성 비율이 약 50%였습니다. 2편의 연구는 남성만을 대상으로 하였으며, 나머지 연구에서는 성별에 대한 언급이 없었습니다. 모든 연구에서 환자의 중앙 연령은 50세를 초과하였습니다.



특히, 5편의 연구에서는 50~60세의 환자를 포함하였고²⁷, ²⁸, ³⁰, ³⁴, ³⁶, 6편은 61~70세²¹, ¹³, ¹⁸, ²², ²³, ³³, 8편은 71세 이상 환자를 포함하였습니다.¹⁹, ²⁰, ²⁴–²⁶, ²⁹, ³², ³⁸
총 27편의 연구 중 대부분은 유럽에서 수행되었으며, 특히 11편(40.8%)은 북유럽(덴마크, 핀란드, 스웨덴), 7편(25.9%)은 기타 유럽 국가(영국, 이탈리아, 스페인, 독일)에서 수행되었습니다. 미국에서 수행된 연구는 7편(25.9%), 동아시아(중국)에서 수행된 연구는 2편(7.4%)이었습니다. 연구 설계는 17편(63%)에서 전향적(prospective)이었습니다.
PA(악성빈혈)의 진단 기준은 22편(81.5%)의 연구에서 구체적으로 기술되어 있었습니다. 특히, 혈액검사(거대적아구성 빈혈, 저비타민 B12, 철분, 가스트린, 펩시노겐 I), Schilling 검사 양성, 위 pH, 거대적아구성 골수소견, 신경병증(척수변성증, 말초신경병증, 치매) 등의 임상 기준이 17편의 연구에서 사용되었습니다.¹², ¹³, ¹⁷, ¹⁸, ²⁰, ²⁴, ²⁶, ²⁷, ³⁰–³⁸
4편의 연구는 ICD(국제질병분류)에 근거하여 데이터를 추출하였고¹⁹, ²⁵, ²⁸, ²⁹, 1편의 연구는 병원 기록을 기반으로 하였습니다.¹⁴ 또한, 5편의 연구에서는 PA 환자를 포함하였으나 구체적인 진단 기준은 제시하지 않았습니다.¹⁵, ¹⁶, ²¹–²³
환자의 모집 경로는 다양하였습니다.
14편의 연구는 입원 치료 후 외래로 추적 관찰된 환자를 포함하였고,¹², ¹⁴, ²⁰–²⁴, ²⁶, ²⁷, ³⁰–³², ³⁵, ³⁷
4편은 일반 인구를 대표하는 입원 환자를 포함하였으며,¹⁹, ²⁵, ²⁸, ²⁹
2편은 입원 및 외래 환자를 모두 포함하였고,³⁴, ³⁸
3편은 빈혈 또는 위장 증상으로 혈액내과 또는 소화기내과에 의뢰된 외래 환자를 포함하였습니다.¹⁸, ³³, ³⁶
3편의 연구¹³, ¹⁶, ¹⁷는 환자의 모집 경로에 대한 정보가 없었고, Blackburn 연구¹⁵에서는 8개의 PA 클리닉 기록에서 환자 정보를 확보하였으나, 이들이 입원 환자인지는 명시되지 않았습니다.
추적 관찰 방법은 연구마다 매우 다양하였습니다. 총 9편(33.3%)의 연구만이 다양한 진단 도구를 기반으로 한 능동적(active) 추적 관찰을 수행하였으며, 사용된 방법은 다음과 같습니다:
위내시경 및 생검(EGD with biopsies, n = 6)¹⁷, ¹⁸, ²³, ²⁷, ³⁴, ³⁶
세포검사(cytology, n = 1)¹⁶
위내시경 또는 X선(EGD or X-ray, n = 1)²⁴
임상적 평가/위내시경(clinical/EGD, n = 1)²⁰
대부분의 연구(n = 18)에서는 능동적 추적 관찰이 이루어지지 않았으나, 이 중 3편의 연구에서는 새로운 임상 증상이 나타난 경우 진단 검사가 시행되었습니다.¹², ³¹, ³⁸
Identification of GC
총 9편의 연구에서는 위내시경 및 생검(EGD with biopsies)을 통해 위암(GC)을 진단하였으며¹⁷, ¹⁸, ²⁰, ²³, ²⁷, ³³, ³⁴, ³⁶, ³⁸, 6편의 연구는 사망진단서나 병원 기록에서 해당 정보를 추출하였습니다.¹⁴, ¹⁵, ²¹, ²⁶, ³⁰, ³⁷ 4편의 연구는 컴퓨터 기반 파일상의 국제질병분류(ICD)를 이용하였으며¹⁹, ²⁵, ²⁸, ²⁹, 나머지 연구들은 다음과 같은 다양한 방법을 사용하였습니다:
X선 및 수술/부검(n = 3)¹⁶, ³¹, ³²
위내시경 또는 X선(n = 4)¹³, ²², ²⁴, ³⁵
위내시경/임상 면담/사망진단서 병용(n = 1)¹²
연구가 수행된 국가별로 person-year 당 위암 발생률을 살펴본 결과,
미국의 7편의 연구에서는 0%에서 0.2%의 발생률을 보였고,
아시아의 2편의 연구에서는 0%에서 0.5%,
북유럽 11편의 연구에서는 0%에서 1.2%,
기타 유럽 국가 7편의 연구에서는 0%에서 0.9%의 발생률을 나타냈습니다.
위암 진단 방법에 따라 보면,
EGD를 사용한 연구에서는 위암 발생률이 0%에서 1.2%,
사망진단서를 사용한 연구에서는 0.2%에서 0.9%,
ICD를 사용한 연구에서는 0.1%에서 0.4%,
다양한 방법을 병용한 연구에서는 0%에서 0.6%의 발생률을 보였습니다.
입원 환자 또는 외래 환자만 포함한 연구들 간에도, 그리고 후향적 또는 전향적 설계에 따라도 위암 발생률은 유사하였습니다.
연구 간 이질성은 통계적으로 유의하지 않았으며(Chi-제곱검정 = 17.9, 자유도 = 11, P = 0.08), 전체적으로 총 22,417명의 PA 환자가 포함되었고, 총 157,319.8 person-year 동안 417건의 신규 위암 사례가 보고되었습니다. 이는 person-year 당 통합 위암 발생률이 0.26%임을 의미합니다.
Table 1에 나타난 바와 같이, 위내시경 및 조직검사를 포함한 능동적 추적 관찰 프로토콜이 시행된 6편의 연구만 고려한 경우, person-year 당 통합 위암 발생률은 0.27%(95% CI: 0.25–0.29)였으며, 이는 2,563.4 person-year 동안 7건의 신규 위암 사례에 해당합니다.

Figure 2에 제시된 바와 같이, 이 6편의 연구에서 계산된 연간 위암 발생률을 이용하여 수행한 메타분석 결과, PA 환자에서의 전체 위암 상대위험도(RR)는 6.8(95% CI: 2.6–18.1)이었으며, 이질성이 유의하므로(Q = 81.3, P < 0.0001) 무작위 효과(random effects) 모형을 적용하였습니다.

DISCUSSION
위암은 악성빈혈(PA)의 가장 심각한 장기 합병증이며, 우리가 알기로는 이번 연구가 위암 발생률을 추정한 최초의 체계적 문헌고찰입니다. 우리는 기간 제한 없이 주요 언어를 포함한 많은 검색어와 그 조합을 사용하여 포괄적인 검색 전략을 수행했습니다. 15,387편의 논문 중에서, 선정 기준에 따라 1950년부터 2011년 사이에 발표된 PA 환자 총 22,417명을 다룬 27편의 논문을 선택했습니다. 구체적으로, 157,319.8 person-year의 추적 관찰 기간 동안 417건의 신규 위암 사례가 확인되었으며, 이는 PA 환자에서 person-year 당 통합 위암 발생률 0.26% (0%~1.2%)에 해당합니다.
포함된 연구들의 질을 평가하기 위해 Newcastle-Ottawa Quality Scale(코호트 연구용)을 적용하였으며, 이를 통해 데이터의 비판적 평가가 가능했습니다. 안타깝게도, 포함된 연구들 중 거의 절반이 낮거나 매우 낮은 질을 보였습니다. 27편의 연구들은 위암 발생률이 유사했으나, 임상적 및 방법론적 이질성은 존재했습니다. 본 리뷰에 포함된 연구들은 유럽과 미국이 잘 대표되고 있으나, 아시아 국가에 대한 결론은 단 두 편의 중국 연구에만 기반하고 있습니다. 실제로 PA는 모든 인종과 민족에 영향을 미칠 수 있지만, 세계에서 가장 인구가 많은 지역인 중국에 관한 정보는 상대적으로 적습니다. 포함된 연구는 중국에서 발표된 가장 큰 두 연구이나, 동아시아 국가에서 PA의 실제 발생률을 확립하기 위해서는 더욱 정확한 진단 전략과 엄격한 방법론을 갖춘 연구가 필요합니다.
대부분의 환자 모집원은 병원이었고, 연구 설계는 10편(37%)에서 후향적이었습니다. 그러나 연구 설계나 환자 모집원과 상관없이 위암 발생률은 유사하게 나타났습니다.
포함된 연구들 간 가장 중요한 차이는 추적 관찰 방법입니다. 단 9편의 연구만이 능동적 추적 관찰을 실시했으며¹⁶–¹⁸, ²⁰, ²³, ²⁴, ²⁷, ³⁴, ³⁶, 그중 6편만이 위내시경과 생검 조직학 평가를 함께 사용했습니다¹⁷, ¹⁸, ²³, ²⁷, ³⁴, ³⁶. 연구마다 접근 방법이 다르며, 이는 연구가 수행된 시기 차이를 반영합니다. 오래된 연구 중에는 세포진 검사¹⁶나 위내시경 카메라²²를 사용한 사례도 있었으나, 20세기 내내 임상에서 광범위하게 사용된 X선 영상으로 완전히 대체되었습니다. 섬유내시경과 이어서 비디오 내시경의 도입은 상부 위장관을 직접 관찰할 수 있게 하여 위 질환 진단에 혁명을 일으켰습니다. 능동적 추적 관찰 연구들은 1980년대 이후 이 도구들이 임상에서 보다 쉽게 사용 가능해지면서 시작되었습니다. 임상 증상과 무관하게 X선이나 위내시경을 통한 정기적 추적은 위암을 조기에 진단할 수 있습니다.
과거 연구들은 주로 사망진단서에 기반해 위암 발생률을 산출한 반면, 능동적 추적관찰 연구들은 조기 위암 진단을 위해 EGD나 X선을 활용했으므로 연구 간 비교가 어렵습니다. 이러한 진단 방법(사망진단서 또는 X선)의 차이는 PA 환자에서 위종양을 위선암이 아닌 위 신경내분비종양으로 오분류했을 가능성을 내포합니다. 실제로 모든 연구에서 조직학적 진단이 체계적으로 이루어지지 않았으며, 9편에서는 보고조차 되지 않았습니다¹⁴, ¹⁵, ¹⁹, ²¹, ²⁸, ²⁹, ³⁵, ³⁷. 이 한계를 고려하면 위선암 비율은 보고된 것보다 낮을 수 있습니다. 그럼에도 불구하고, 위내시경과 조직학에 의한 능동적 추적 관찰을 시행한 6편의 연구에서 산출된 person-year 당 위암 발생률 0.27%(7/2563)는 전체 연구를 고려한 추정치와 일치하여 분석의 신뢰성을 뒷받침합니다.
따라서 본 체계적 문헌고찰의 주요 결과는 연구별 설계(국가, 환자 모집원, 표본 크기, 추적 방법, 위암 확인 방법)에서 큰 이질성이 있음에도 불구하고, 위암 발생률은 모든 연구에서 상당히 안정적이고 유사하다는 점입니다.
*** 이 결과를 일반 인구의 위암 발생률과 비교하기는 어렵습니다. 그 이유는 (i) 일반 인구의 발생률은 연구 지역, 국가별, 심지어 같은 국가 내에서도 지역별로 매우 다양하며, 비교 대상으로 어떤 ‘일반 인구’를 사용할지 명확하지 않고, (ii) 전 세계 거의 모든 국가에서 위암 발생률이 해마다 꾸준히 감소하고 있는데, 본 연구는 1950년부터 2011년까지 기간 제한 없이 연구를 포함해 일반 인구 발생률과의 비교가 매우 어렵기 때문입니다. ***
그럼에도 이러한 한계를 염두에 두고, 우리는 능동적 내시경-조직학적 추적을 시행한 6편 연구에서 계산된 PA 환자의 연간 위암 발생률을 기반으로 메타분석을 수행했고, 각 연구가 수행된 국가별 40세 이상 일반 인구의 연간 위암 발생률과 비교했습니다. 이 분석 결과, PA 환자의 위암 상대위험도(RR)는 6.8배로 나타났습니다. 위에서 언급한 제한점으로 인해 본 메타분석 결과가 편향되었을 가능성을 인지하고 있으나, PA 환자의 위암 발생 가능성을 추정하는 데 있어 허용 가능한 결과라고 생각하며, 이후 인구 기반의 전향적 연구 설계의 출발점으로 삼을 수 있다고 봅니다.
PA 환자의 연간 위암 발생률 범위는 문헌에 보고된 위축성 위염 환자의 연간 발생률 0%~1.8%와 겹칩니다. 이는 놀라운 일이 아닙니다. 왜냐하면 PA는 위축성 위염의 임상적 표현형 중 하나이기 때문입니다. 이전 연구들에서 위축성 위염 환자들은 철 결핍성 빈혈뿐 아니라 PA도 나타낼 수 있음이 보고되었습니다. 일반적으로 철 결핍성 빈혈 환자는 PA 환자에 비해 젊고 여성 비율이 더 높습니다. 본 체계적 고찰의 중간 연령은 50세 이상으로, PA가 주로 노년층에서 나타나는 질환임을 확인시켜 줍니다. 이는 비타민 B12 고갈이 수년이 걸리며 위축성 위염의 후기 단계에서 발생하기 때문으로 설명할 수 있습니다. 따라서 PA는 전형적으로 위체부에 국한된 위축과 연관되지만, 다발성 위축성 위염과 같은 잘 알려진 전암성 상태의 늦은 임상적 표현일 수 있습니다.
안타깝게도 포함 연구들에서 PA 진단에 기저한 위염 유형을 체계적으로 기술하지 않아 이를 평가할 수 없었습니다. 또한 본 체계적 문헌고찰의 또 다른 제한점은 위암의 알려진 위험인자인 헬리코박터 파일로리(H. pylori)를 고려할 수 없었다는 점입니다. 사실 포함 연구 중 약 50%는 H. pylori 발견 이전에 수행되었습니다. 일부 연구에서는 H. pylori 감염이 PA 환자에서는 드문 소견이라고 보고하여 PA 병리 과정이 위의 H. pylori 집락 형성을 방어할 가능성을 제시했습니다. 반면, 다른 연구에서는 PA 환자가 H. pylori 항체 양성률이 높고 위 점막 내 H. pylori 염색은 낮아 과거 또는 잠복 감염을 반영한다고 하였습니다. 하지만 이 내용들은 본 체계적 문헌고찰의 주제 범위를 벗어납니다.
최근 가이드라인에서는 위축성 위염, 장상피화생, 이형성과 같은 전암성 상태 및 병변 환자의 관리 표준화를 제안하여, 위암 위험이 가장 높은 환자에게 자원을 집중하는 비용효과적인 감시 프로그램을 권장하고 있습니다.⁷ 위축성 위염 환자와 악성빈혈(PA) 환자는 임상 증상(빈혈, 비타민 B12 결핍, 신경학적 증상), 조직학적 병변(위축, 장상피화생), 위암 발생률이 유사하며, PA는 위축성 위염의 다양한 임상 양상 중 한 단계로 볼 수 있습니다.², ⁶
PA 환자의 내시경 감시에 관한 필요성은 추가 연구가 필요합니다. 또한 PA 환자에서 위 신경내분비종양 발생 위험 증가가 내시경 감시의 또 다른 잠재적 근거가 될 수 있습니다.
결론적으로, 포함된 연구들 간 이질성이 있음에도 불구하고 본 체계적 문헌고찰은 PA 환자에서 person-year 당 위암 발생률이 0.27%임을 보여주며, PA 환자의 위암 상대위험도는 약 7배로 추정됩니다. 이 높은 위험도를 확인하기 위해서는 보다 질 높은 추가 연구가 필요합니다.
<Abstract>
Background: Pernicious anaemia (PA) has an increased risk for gastric cancer (GC). It is not established whether PA patients need to undergo endoscopic/histological follow-up.
Aim: To provide a systematic overview of the literature on PA and the development of gastric cancer, to estimate the gastric cancer incidence-rate.
Methods: According to PRISMA, we identified studies on PA patients reporting the incidence of gastric cancer. Quality of studies was evaluated using the Newcastle-Ottawa Quality Assessment Scale. Meta-analysis on annual gastric cancer incidence rates was performed.
Results: Twenty-seven studies met eligibility criteria. 7 studies were of high, 6 of medium, 10 of low and 4 of very low quality. Gastric cancer incidence-rates ranged from 0% to 0.2% per person-years in 7 American, from 0% to 0.5% in 2 Asiatic, from 0% to 1.2% in 11 Northern European studies and from 0% to 0.9% in 7 studies from other European countries. The incidence-rates of gastric cancer ranged from 0% to 1.2% per person-years in studies which used gastroscopy, from 0.1% to 0.9% in those based on International Classification of Disease. Heterogeneity between studies was not statistically significant at the 5% level (Chi-squared test = 17.9, P = 0.08). The calculated pooled gastric cancer incidence-rate was 0.27% per person-years. Meta-analysis showed overall gastric cancer relative risk in PA as 6.8 (95% CI: 2.6-18.1).
Conclusions: This systematic review shows a pooled gastric cancer incidence-rate in pernicious anaemia of 0.27% per person-years and an estimated nearly sevenfold relative risk of gastric cancer in pernicious anaemia patients. Further high quality studies are needed to confirm this higher risk.
L. Vannella, E. Lahner, J. Osborn, B. Annibale
Aliment Pharmacol Ther. 2013 Feb;37(4):375-82. doi: 10.1111/apt.12177.
INTRODUCTION
악성빈혈(Pernicious anaemia, PA)은 Biermer병으로도 알려져 있으며, 위 체부 점막의 위축성 손상을 특징으로 하는 자가면역 질환으로 간주됩니다. 이로 인해 정상적으로 음식물에서 흡수된 비타민 B12와 강하게 결합하여 회장의 점막 벽을 통해 운반하는 단백질인 내인자의 생성에 관여하는 벽세포가 손실됩니다. 내인자 부족은 비타민 B12 결핍과 그로 인한 거대적아구성 빈혈 발생의 병태생리학적 기전이며, 이는 PA의 가장 흔한 임상 증상입니다. 임상적으로 PA는 서서히 나타날 수 있으며 다양한 양상으로 표현됩니다. 일반적으로 증상은 서서히 나타나며 빈혈과 관련이 있거나, 말초 신경병증 또는 더 심각한 신경학적 합병증 등과 관련이 있을 수 있습니다.
더 나아가, PA 환자들은 위암(Gastric Cancer, GC)과 같은 장기적인 합병증을 겪을 수 있습니다. PA 환자에서 위암 발생 위험은 문헌에 보고되어 있으나, 연구마다 대상자 수나 추적관찰 기간 동안 위암을 확인하는 방법이 달라 그 결과가 서로 상이합니다. PA 환자에서 흔히 보이는 날문(유문)부는 보존되고 체부에 국한된 위축성 위염은 Correa가 제시한 위암 전구 병변 경로에는 포함되지 않습니다. 반면, 위점막의 더 광범위한 위축(다병소성 위축성 위염)은 위 신생물 병변으로의 진행 위험 증가와 연관되어 있는 것으로 보입니다.
또한 PA의 임상적 발현은 수년간 존재했을 가능성이 있는 위축성 위염의 자연 경과에서 마지막 단계일 수 있다고 보고된 바 있습니다. 위와 같은 점을 고려할 때, PA 환자와 위축성 위염 환자에 대해 서로 다른 임상적 관리를 적용하는 것은 타당하지 않아 보입니다. 최근, 위의 전암성 병변 및 병태에 대한 관리를 위한 전문가 위원회가 권고안을 발표하였으나, 그 지침은 PA와 같은 전암성 병태에는 적용되지 않는다고 명시하였습니다. 반면, 영국 소화기학회 및 외과종양학회에서 제시한 위암 관리 지침에서는 PA가 전암성 병태로 간주될 수 있으며 내시경 추적관찰의 고려 대상이 될 수 있다고 언급되었지만, 구체적인 지침은 여전히 부족합니다.
따라서 PA 환자의 관리에 대해서는 논란이 지속되고 있으며, 이들에서의 위암 발생 위험의 정도는 아직 명확히 규명되지 않았습니다. 이에 우리는 PA와 위암 발생에 관한 기존 문헌을 고찰하고, PA 환자에서의 위암 발생률을 추정하고자 하였습니다.
MATERIALS AND METHODS
Literature search strategy
본 리뷰는 PubMed에서 체계적인 전산 검색을 통해 확인된 악성빈혈(PA)에 관한 연구들의 발표된 결과를 기반으로 하였습니다. PubMed 데이터베이스는 2011년 9월 15일까지 발표된 논문들을 대상으로 검색되었습니다. PubMed에 대한 전체 검색 전략은 부록(Table S1)에 포함되어 있으며, 다음과 같은 검색 용어들을 포함하였다: 악성빈혈(pernicious anaemia), 위축성 위염(atrophic gastritis), A형 위염(Type A gastritis), 거대적아구성 빈혈(macrocytic anaemia), 코발라민 결핍(cobalamin deficiency), 비타민 B12 결핍(vitamin B12 deficiency), 내인성 인자 결핍(intrinsic factor deficiency), 자가면역성 위염(autoimmune gastritis), 위암(stomach cancer), 위암(gastric cancer), 위선암(gastric adenocarcinoma), 위신생물(gastric neoplas*), 위암종(gastric carcinoma), 위종양(gastric tumour). 본 검색은 PRISMA 지침에 따라 수행되었습니다. 또한 포함된 연구들의 참고문헌 목록도 함께 검색하였습니다.
Study selection
포함 및 제외 기준
다음의 모든 기준을 충족하는 연구는 본 체계적 문헌고찰에 포함하였습니다:
(i) PA(악성빈혈) 환자를 대상으로 하며, 명확한 추적 관찰 기간 동안 위암(GC) 발생 건수를 보고한 관찰연구일 것,
(ii) 성인 환자를 대상으로 한 연구일 것,
(iii) 고유한 데이터를 제시한 원본 논문일 것.
연구 시기에 대한 제한은 두지 않았습니다.
다음의 경우에는 연구에서 제외하였습니다:
(i) 리뷰, 편지, 사설, 증례보고 등 원본 논문이 아닌 경우,
(ii) 추적 관찰 데이터가 제공되지 않은 경우,
(iii) 영어, 스페인어, 이탈리아어, 독일어, 프랑스어 이외의 언어로 작성된 경우.
선정 과정
연구의 선정은 두 명의 연구자(LV와 EL)가 제목과 초록을 바탕으로 독립적으로 수행하였습니다. 판단이 어려운 경우에는 원문 전체를 검토하였습니다. 의견이 일치하지 않는 경우에는 제3의 연구자(BA)와의 논의를 통해 조율하였습니다.
Data extraction
두 명의 연구자(LV와 EL)가 각 논문으로부터 다음의 정보를 독립적으로 추출하였습니다: 제1저자의 성, 발표 연도, 연구가 수행된 국가, 연구 설계, PA 진단 기준, 연구 대상자 선정 방법, 조사된 환자 수, 추적 관찰 기간(년), 인년(person-years) 계산 여부, 환자의 연령(중앙값, 평균 또는 범위), 성별, 추적 관찰 방식(능동적 여부), 추적 관찰 방법, 위암(GC) 확인 방법, 병리소견, 위암 발생 건수.
Quality assessment
두 명의 연구자(LV와 EL)는 포함된 모든 연구의 질을 Newcastle-Ottawa 평가 척도(Newcastle-Ottawa Quality Assessment Scale)를 사용하여 평가하였습니다. 이 척도는 코호트 연구를 대상으로 하며, 각 연구에 최대 9점(별)을 부여할 수 있습니다. 평가 항목은 세 가지 범주로 구성되며, 각각은 다음과 같습니다:
연구 대상군(코호트)의 선정(4개 항목),
결과 평가(3개 항목),
연구 대상군과 비교군 간의 비교 가능성(2개 항목).
Selection과 Outcome Assessment 항목에서는 각 항목당 최대 1점, Comparability 항목에서는 최대 2점을 받을 수 있습니다.
본 연구에서는 임의적으로 연구의 질을 다음과 같이 분류하였습니다:
9점을 받은 연구: 고품질(high quality),
7~8점: 중간 품질(medium quality),
5~6점: 저품질(low quality),
4점 이하: 매우 낮은 품질(very low quality).
평가 결과에 차이가 있을 경우, 두 명의 연구자(LV와 EL)가 논의를 통해 조율하였습니다.
Outcome
관심 있는 결과 지표는 위암(GC)의 발생률이었으며, 이는 추적 관찰 기간 동안 새롭게 진단된 위암의 수를 인년(person-years)으로 나누어 계산하였습니다.
Statistical analysis
각 포함된 연구로부터, 위암(GC) 발생 건수와 위험 노출 인년(person-years)을 추출하였습니다. 연구에서 명확하게 제시되지 않은 경우에는 검토자들이 인년당 발생률을 직접 계산하였습니다. 통계적 이질성은 카이제곱(Chi-squared) 검정을 통해 평가하였으며, 적절한 경우에는 Mann–Whitney 검정을 사용하였습니다. P값이 0.05 미만인 경우를 통계적으로 유의한 것으로 간주하였습니다.
인년당 위암 발생률의 통합 비율과 95% 신뢰구간을 계산하였습니다. PA(악성빈혈) 환자에서 전체 위암 상대위험도(relative risk, RR)를 추정하기 위해, 선택된 연구들 중 내시경 및 조직검사를 기반으로 한 능동적 추적 관찰을 통해 위암이 진단된 연구들에서 PA 환자의 연간 위암 발생률을 계산하였습니다. 이 위암 발생률은 메타분석에 사용되었고, GLOBOCAN 웹사이트에서 제공하는 유럽 각국의 40세 이상 일반 인구(남녀 모두)의 연간 위암 발생률과 비교하여, PA 환자에서 위암 발생 위험도를 산출하였습니다. 이때 연간 발생률은 일정하다는 가정하에 계산되었습니다. 통계 분석은 전용 소프트웨어(MedCalc Software, 버전 11.3; 벨기에 마리아케르케)를 사용하여 수행하였습니다.
RESULTS
Search results
전자 검색 전략을 통해 PubMed에서 총 15,387건의 기록이 확인되었으며, 이 중 중복을 제거한 고유 문헌은 2,760건이었습니다(Figure 1). 이들 문헌은 제목과 초록을 기준으로 선별하였으며, 포함 및 제외 기준을 적용한 후 71편의 논문을 원문 평가 대상으로 선정하였습니다. 이 중 71편의 원문 논문 중 27편이 최종적으로 적합 기준을 충족하여 자료 추출에 포함되었습니다.¹²⁻³⁸
Quality assessment
포함된 연구들의 전반적인 질 평가는 Table S2에 제시되어 있습니다. 고품질로 평가된 연구는 7편, 중간 품질은 6편, 저품질은 10편, 매우 낮은 품질은 4편이었습니다. 고품질로 분류된 7편 중 4편의 연구¹⁹, ²⁵, ²⁸, ²⁹는 미국 및 북유럽 지역의 지역사회를 대표하며, 대규모 표본을 보고한 연구였습니다.
반면, 저품질 및 매우 낮은 품질로 평가된 연구들의 대부분은 일치시킨 코호트 연구(matched cohort study)가 아니었고, 이로 인해 Newcastle-Ottawa 평가 척도의 "비교 가능성(Comparability)" 항목을 평가할 수 없었습니다.¹², ¹³, ¹⁶–¹⁸, ²⁰–²⁴, ³¹, ³⁴, ³⁷, ³⁸
Characteristics of included studies
포함된 연구들의 특성은 Table S3에 요약되어 있습니다. 여성의 비율이 높은 연구는 14편으로, 여성 비율은 55.3%에서 81.2% 사이였고, 4편의 연구에서는 여성 비율이 약 50%였습니다. 2편의 연구는 남성만을 대상으로 하였으며, 나머지 연구에서는 성별에 대한 언급이 없었습니다. 모든 연구에서 환자의 중앙 연령은 50세를 초과하였습니다.
특히, 5편의 연구에서는 50~60세의 환자를 포함하였고²⁷, ²⁸, ³⁰, ³⁴, ³⁶, 6편은 61~70세²¹, ¹³, ¹⁸, ²², ²³, ³³, 8편은 71세 이상 환자를 포함하였습니다.¹⁹, ²⁰, ²⁴–²⁶, ²⁹, ³², ³⁸
총 27편의 연구 중 대부분은 유럽에서 수행되었으며, 특히 11편(40.8%)은 북유럽(덴마크, 핀란드, 스웨덴), 7편(25.9%)은 기타 유럽 국가(영국, 이탈리아, 스페인, 독일)에서 수행되었습니다. 미국에서 수행된 연구는 7편(25.9%), 동아시아(중국)에서 수행된 연구는 2편(7.4%)이었습니다. 연구 설계는 17편(63%)에서 전향적(prospective)이었습니다.
PA(악성빈혈)의 진단 기준은 22편(81.5%)의 연구에서 구체적으로 기술되어 있었습니다. 특히, 혈액검사(거대적아구성 빈혈, 저비타민 B12, 철분, 가스트린, 펩시노겐 I), Schilling 검사 양성, 위 pH, 거대적아구성 골수소견, 신경병증(척수변성증, 말초신경병증, 치매) 등의 임상 기준이 17편의 연구에서 사용되었습니다.¹², ¹³, ¹⁷, ¹⁸, ²⁰, ²⁴, ²⁶, ²⁷, ³⁰–³⁸
4편의 연구는 ICD(국제질병분류)에 근거하여 데이터를 추출하였고¹⁹, ²⁵, ²⁸, ²⁹, 1편의 연구는 병원 기록을 기반으로 하였습니다.¹⁴ 또한, 5편의 연구에서는 PA 환자를 포함하였으나 구체적인 진단 기준은 제시하지 않았습니다.¹⁵, ¹⁶, ²¹–²³
환자의 모집 경로는 다양하였습니다.
14편의 연구는 입원 치료 후 외래로 추적 관찰된 환자를 포함하였고,¹², ¹⁴, ²⁰–²⁴, ²⁶, ²⁷, ³⁰–³², ³⁵, ³⁷
4편은 일반 인구를 대표하는 입원 환자를 포함하였으며,¹⁹, ²⁵, ²⁸, ²⁹
2편은 입원 및 외래 환자를 모두 포함하였고,³⁴, ³⁸
3편은 빈혈 또는 위장 증상으로 혈액내과 또는 소화기내과에 의뢰된 외래 환자를 포함하였습니다.¹⁸, ³³, ³⁶
3편의 연구¹³, ¹⁶, ¹⁷는 환자의 모집 경로에 대한 정보가 없었고, Blackburn 연구¹⁵에서는 8개의 PA 클리닉 기록에서 환자 정보를 확보하였으나, 이들이 입원 환자인지는 명시되지 않았습니다.
추적 관찰 방법은 연구마다 매우 다양하였습니다. 총 9편(33.3%)의 연구만이 다양한 진단 도구를 기반으로 한 능동적(active) 추적 관찰을 수행하였으며, 사용된 방법은 다음과 같습니다:
위내시경 및 생검(EGD with biopsies, n = 6)¹⁷, ¹⁸, ²³, ²⁷, ³⁴, ³⁶
세포검사(cytology, n = 1)¹⁶
위내시경 또는 X선(EGD or X-ray, n = 1)²⁴
임상적 평가/위내시경(clinical/EGD, n = 1)²⁰
대부분의 연구(n = 18)에서는 능동적 추적 관찰이 이루어지지 않았으나, 이 중 3편의 연구에서는 새로운 임상 증상이 나타난 경우 진단 검사가 시행되었습니다.¹², ³¹, ³⁸
Identification of GC
총 9편의 연구에서는 위내시경 및 생검(EGD with biopsies)을 통해 위암(GC)을 진단하였으며¹⁷, ¹⁸, ²⁰, ²³, ²⁷, ³³, ³⁴, ³⁶, ³⁸, 6편의 연구는 사망진단서나 병원 기록에서 해당 정보를 추출하였습니다.¹⁴, ¹⁵, ²¹, ²⁶, ³⁰, ³⁷ 4편의 연구는 컴퓨터 기반 파일상의 국제질병분류(ICD)를 이용하였으며¹⁹, ²⁵, ²⁸, ²⁹, 나머지 연구들은 다음과 같은 다양한 방법을 사용하였습니다:
X선 및 수술/부검(n = 3)¹⁶, ³¹, ³²
위내시경 또는 X선(n = 4)¹³, ²², ²⁴, ³⁵
위내시경/임상 면담/사망진단서 병용(n = 1)¹²
연구가 수행된 국가별로 person-year 당 위암 발생률을 살펴본 결과,
미국의 7편의 연구에서는 0%에서 0.2%의 발생률을 보였고,
아시아의 2편의 연구에서는 0%에서 0.5%,
북유럽 11편의 연구에서는 0%에서 1.2%,
기타 유럽 국가 7편의 연구에서는 0%에서 0.9%의 발생률을 나타냈습니다.
위암 진단 방법에 따라 보면,
EGD를 사용한 연구에서는 위암 발생률이 0%에서 1.2%,
사망진단서를 사용한 연구에서는 0.2%에서 0.9%,
ICD를 사용한 연구에서는 0.1%에서 0.4%,
다양한 방법을 병용한 연구에서는 0%에서 0.6%의 발생률을 보였습니다.
입원 환자 또는 외래 환자만 포함한 연구들 간에도, 그리고 후향적 또는 전향적 설계에 따라도 위암 발생률은 유사하였습니다.
연구 간 이질성은 통계적으로 유의하지 않았으며(Chi-제곱검정 = 17.9, 자유도 = 11, P = 0.08), 전체적으로 총 22,417명의 PA 환자가 포함되었고, 총 157,319.8 person-year 동안 417건의 신규 위암 사례가 보고되었습니다. 이는 person-year 당 통합 위암 발생률이 0.26%임을 의미합니다.
Table 1에 나타난 바와 같이, 위내시경 및 조직검사를 포함한 능동적 추적 관찰 프로토콜이 시행된 6편의 연구만 고려한 경우, person-year 당 통합 위암 발생률은 0.27%(95% CI: 0.25–0.29)였으며, 이는 2,563.4 person-year 동안 7건의 신규 위암 사례에 해당합니다.
Figure 2에 제시된 바와 같이, 이 6편의 연구에서 계산된 연간 위암 발생률을 이용하여 수행한 메타분석 결과, PA 환자에서의 전체 위암 상대위험도(RR)는 6.8(95% CI: 2.6–18.1)이었으며, 이질성이 유의하므로(Q = 81.3, P < 0.0001) 무작위 효과(random effects) 모형을 적용하였습니다.
DISCUSSION
위암은 악성빈혈(PA)의 가장 심각한 장기 합병증이며, 우리가 알기로는 이번 연구가 위암 발생률을 추정한 최초의 체계적 문헌고찰입니다. 우리는 기간 제한 없이 주요 언어를 포함한 많은 검색어와 그 조합을 사용하여 포괄적인 검색 전략을 수행했습니다. 15,387편의 논문 중에서, 선정 기준에 따라 1950년부터 2011년 사이에 발표된 PA 환자 총 22,417명을 다룬 27편의 논문을 선택했습니다. 구체적으로, 157,319.8 person-year의 추적 관찰 기간 동안 417건의 신규 위암 사례가 확인되었으며, 이는 PA 환자에서 person-year 당 통합 위암 발생률 0.26% (0%~1.2%)에 해당합니다.
포함된 연구들의 질을 평가하기 위해 Newcastle-Ottawa Quality Scale(코호트 연구용)을 적용하였으며, 이를 통해 데이터의 비판적 평가가 가능했습니다. 안타깝게도, 포함된 연구들 중 거의 절반이 낮거나 매우 낮은 질을 보였습니다. 27편의 연구들은 위암 발생률이 유사했으나, 임상적 및 방법론적 이질성은 존재했습니다. 본 리뷰에 포함된 연구들은 유럽과 미국이 잘 대표되고 있으나, 아시아 국가에 대한 결론은 단 두 편의 중국 연구에만 기반하고 있습니다. 실제로 PA는 모든 인종과 민족에 영향을 미칠 수 있지만, 세계에서 가장 인구가 많은 지역인 중국에 관한 정보는 상대적으로 적습니다. 포함된 연구는 중국에서 발표된 가장 큰 두 연구이나, 동아시아 국가에서 PA의 실제 발생률을 확립하기 위해서는 더욱 정확한 진단 전략과 엄격한 방법론을 갖춘 연구가 필요합니다.
대부분의 환자 모집원은 병원이었고, 연구 설계는 10편(37%)에서 후향적이었습니다. 그러나 연구 설계나 환자 모집원과 상관없이 위암 발생률은 유사하게 나타났습니다.
포함된 연구들 간 가장 중요한 차이는 추적 관찰 방법입니다. 단 9편의 연구만이 능동적 추적 관찰을 실시했으며¹⁶–¹⁸, ²⁰, ²³, ²⁴, ²⁷, ³⁴, ³⁶, 그중 6편만이 위내시경과 생검 조직학 평가를 함께 사용했습니다¹⁷, ¹⁸, ²³, ²⁷, ³⁴, ³⁶. 연구마다 접근 방법이 다르며, 이는 연구가 수행된 시기 차이를 반영합니다. 오래된 연구 중에는 세포진 검사¹⁶나 위내시경 카메라²²를 사용한 사례도 있었으나, 20세기 내내 임상에서 광범위하게 사용된 X선 영상으로 완전히 대체되었습니다. 섬유내시경과 이어서 비디오 내시경의 도입은 상부 위장관을 직접 관찰할 수 있게 하여 위 질환 진단에 혁명을 일으켰습니다. 능동적 추적 관찰 연구들은 1980년대 이후 이 도구들이 임상에서 보다 쉽게 사용 가능해지면서 시작되었습니다. 임상 증상과 무관하게 X선이나 위내시경을 통한 정기적 추적은 위암을 조기에 진단할 수 있습니다.
과거 연구들은 주로 사망진단서에 기반해 위암 발생률을 산출한 반면, 능동적 추적관찰 연구들은 조기 위암 진단을 위해 EGD나 X선을 활용했으므로 연구 간 비교가 어렵습니다. 이러한 진단 방법(사망진단서 또는 X선)의 차이는 PA 환자에서 위종양을 위선암이 아닌 위 신경내분비종양으로 오분류했을 가능성을 내포합니다. 실제로 모든 연구에서 조직학적 진단이 체계적으로 이루어지지 않았으며, 9편에서는 보고조차 되지 않았습니다¹⁴, ¹⁵, ¹⁹, ²¹, ²⁸, ²⁹, ³⁵, ³⁷. 이 한계를 고려하면 위선암 비율은 보고된 것보다 낮을 수 있습니다. 그럼에도 불구하고, 위내시경과 조직학에 의한 능동적 추적 관찰을 시행한 6편의 연구에서 산출된 person-year 당 위암 발생률 0.27%(7/2563)는 전체 연구를 고려한 추정치와 일치하여 분석의 신뢰성을 뒷받침합니다.
따라서 본 체계적 문헌고찰의 주요 결과는 연구별 설계(국가, 환자 모집원, 표본 크기, 추적 방법, 위암 확인 방법)에서 큰 이질성이 있음에도 불구하고, 위암 발생률은 모든 연구에서 상당히 안정적이고 유사하다는 점입니다.
*** 이 결과를 일반 인구의 위암 발생률과 비교하기는 어렵습니다. 그 이유는 (i) 일반 인구의 발생률은 연구 지역, 국가별, 심지어 같은 국가 내에서도 지역별로 매우 다양하며, 비교 대상으로 어떤 ‘일반 인구’를 사용할지 명확하지 않고, (ii) 전 세계 거의 모든 국가에서 위암 발생률이 해마다 꾸준히 감소하고 있는데, 본 연구는 1950년부터 2011년까지 기간 제한 없이 연구를 포함해 일반 인구 발생률과의 비교가 매우 어렵기 때문입니다. ***
그럼에도 이러한 한계를 염두에 두고, 우리는 능동적 내시경-조직학적 추적을 시행한 6편 연구에서 계산된 PA 환자의 연간 위암 발생률을 기반으로 메타분석을 수행했고, 각 연구가 수행된 국가별 40세 이상 일반 인구의 연간 위암 발생률과 비교했습니다. 이 분석 결과, PA 환자의 위암 상대위험도(RR)는 6.8배로 나타났습니다. 위에서 언급한 제한점으로 인해 본 메타분석 결과가 편향되었을 가능성을 인지하고 있으나, PA 환자의 위암 발생 가능성을 추정하는 데 있어 허용 가능한 결과라고 생각하며, 이후 인구 기반의 전향적 연구 설계의 출발점으로 삼을 수 있다고 봅니다.
PA 환자의 연간 위암 발생률 범위는 문헌에 보고된 위축성 위염 환자의 연간 발생률 0%~1.8%와 겹칩니다. 이는 놀라운 일이 아닙니다. 왜냐하면 PA는 위축성 위염의 임상적 표현형 중 하나이기 때문입니다. 이전 연구들에서 위축성 위염 환자들은 철 결핍성 빈혈뿐 아니라 PA도 나타낼 수 있음이 보고되었습니다. 일반적으로 철 결핍성 빈혈 환자는 PA 환자에 비해 젊고 여성 비율이 더 높습니다. 본 체계적 고찰의 중간 연령은 50세 이상으로, PA가 주로 노년층에서 나타나는 질환임을 확인시켜 줍니다. 이는 비타민 B12 고갈이 수년이 걸리며 위축성 위염의 후기 단계에서 발생하기 때문으로 설명할 수 있습니다. 따라서 PA는 전형적으로 위체부에 국한된 위축과 연관되지만, 다발성 위축성 위염과 같은 잘 알려진 전암성 상태의 늦은 임상적 표현일 수 있습니다.
안타깝게도 포함 연구들에서 PA 진단에 기저한 위염 유형을 체계적으로 기술하지 않아 이를 평가할 수 없었습니다. 또한 본 체계적 문헌고찰의 또 다른 제한점은 위암의 알려진 위험인자인 헬리코박터 파일로리(H. pylori)를 고려할 수 없었다는 점입니다. 사실 포함 연구 중 약 50%는 H. pylori 발견 이전에 수행되었습니다. 일부 연구에서는 H. pylori 감염이 PA 환자에서는 드문 소견이라고 보고하여 PA 병리 과정이 위의 H. pylori 집락 형성을 방어할 가능성을 제시했습니다. 반면, 다른 연구에서는 PA 환자가 H. pylori 항체 양성률이 높고 위 점막 내 H. pylori 염색은 낮아 과거 또는 잠복 감염을 반영한다고 하였습니다. 하지만 이 내용들은 본 체계적 문헌고찰의 주제 범위를 벗어납니다.
최근 가이드라인에서는 위축성 위염, 장상피화생, 이형성과 같은 전암성 상태 및 병변 환자의 관리 표준화를 제안하여, 위암 위험이 가장 높은 환자에게 자원을 집중하는 비용효과적인 감시 프로그램을 권장하고 있습니다.⁷ 위축성 위염 환자와 악성빈혈(PA) 환자는 임상 증상(빈혈, 비타민 B12 결핍, 신경학적 증상), 조직학적 병변(위축, 장상피화생), 위암 발생률이 유사하며, PA는 위축성 위염의 다양한 임상 양상 중 한 단계로 볼 수 있습니다.², ⁶
PA 환자의 내시경 감시에 관한 필요성은 추가 연구가 필요합니다. 또한 PA 환자에서 위 신경내분비종양 발생 위험 증가가 내시경 감시의 또 다른 잠재적 근거가 될 수 있습니다.
결론적으로, 포함된 연구들 간 이질성이 있음에도 불구하고 본 체계적 문헌고찰은 PA 환자에서 person-year 당 위암 발생률이 0.27%임을 보여주며, PA 환자의 위암 상대위험도는 약 7배로 추정됩니다. 이 높은 위험도를 확인하기 위해서는 보다 질 높은 추가 연구가 필요합니다.
<Abstract>
Background: Pernicious anaemia (PA) has an increased risk for gastric cancer (GC). It is not established whether PA patients need to undergo endoscopic/histological follow-up.
Aim: To provide a systematic overview of the literature on PA and the development of gastric cancer, to estimate the gastric cancer incidence-rate.
Methods: According to PRISMA, we identified studies on PA patients reporting the incidence of gastric cancer. Quality of studies was evaluated using the Newcastle-Ottawa Quality Assessment Scale. Meta-analysis on annual gastric cancer incidence rates was performed.
Results: Twenty-seven studies met eligibility criteria. 7 studies were of high, 6 of medium, 10 of low and 4 of very low quality. Gastric cancer incidence-rates ranged from 0% to 0.2% per person-years in 7 American, from 0% to 0.5% in 2 Asiatic, from 0% to 1.2% in 11 Northern European studies and from 0% to 0.9% in 7 studies from other European countries. The incidence-rates of gastric cancer ranged from 0% to 1.2% per person-years in studies which used gastroscopy, from 0.1% to 0.9% in those based on International Classification of Disease. Heterogeneity between studies was not statistically significant at the 5% level (Chi-squared test = 17.9, P = 0.08). The calculated pooled gastric cancer incidence-rate was 0.27% per person-years. Meta-analysis showed overall gastric cancer relative risk in PA as 6.8 (95% CI: 2.6-18.1).
Conclusions: This systematic review shows a pooled gastric cancer incidence-rate in pernicious anaemia of 0.27% per person-years and an estimated nearly sevenfold relative risk of gastric cancer in pernicious anaemia patients. Further high quality studies are needed to confirm this higher risk.