임의적인 변동을 실제 결과로 혼동할 수 있는 계기는 역학 연구에서 일어날 수 있는 오차들에만 있는 것은 아닙니다. 다른 문제점에서 일어날 수 있는 오차들에만 있는 것은 아닙니다. 다른 문제점은, 영향력 있는 요소에 관한 설명을 잘못하여 자신이 확신하고 있는 방향으로 결과를 왜곡하는 오류의 가능성을 들 수 있습니다. 오류에는 여러 가지 유형이 있지만, 보편적으로 모두 실제 값과 빗나가는 실험적 결과를 야기한다는 공통된 특징을 지닙니다.
쉽게 이해되는 오류의 한 가지 유형은 실험적 오류로서, 객관적 연구를 진행하는 과학자들의 기대로 인해 관찰된 자료의 평가가 방해 받을 때 나타납니다. 예를 들어 연구자들이 특정 화학물질이 암을 유발한다고 믿는다면, 이 믿음은 화학물질에 노출된 많은 사람 중 얼마나 실제 암이 진행되고 있는지에 관한 평가에 영향을 미칠 것입니다. 따라서 이와 같은 연구에서 의학 기록의 평가는 분석에 관여하는 과학자나 각 피검자가 조사중인 시약에 노출되었는지 모르는 '맹검'상태로 진행되어야 합니다.
역학 연구는 비교 가능한 인구의 암발생률을 측정하는 과정에서 동등한 과정을 확실하게 하지 못하여 나타나는 현상인 검출오류에 의해서도 왜곡될 수 있습니다. 예를 들어 공업 지역의 방광암 비율이 2배로 나타난 가상적 상황에서 작업장이 독성 화학물질에 많이 노출되어 있으므로 화학공장장이 직원들에게 건강진단을 더 많이 받게 했다고 가정합시다. 이런 빈번한 건강진단은 엄격한 의학검진을 하지 않는 것에 비해서 더 많은 방광암의 사례를 검출할 수 있습니다. 따라서 공업 지역과 청정 지역의 방광암 발생률은 기본적으로 똑같다고 볼 수도 있으나, 건강검진을 많이 받음으로써 공업 지역에서 더 많은 사례가 보고될 수 있습니다. 이런 상황에서, 눈에 드러나는 공업 지역의 암발생률 '2배'는 검출 오류를 만들어 잘못된 인상을 줄 수 있습니다.
다른 유형의 왜곡은 화상 오류로, 과학자들이 개개인이 작성한 과거의 행동과 발암의심물질에 노출된 것에 관한 자기보고서에만 의존할 때, 보편적으로 나타나는 문제입니다. 예를 들어 이미 암에 걸린 사람의 경우 다른 사람들보다 특정 화학물질에 노출되었던 과거 기억을 되살리는 데 더 적극적일 것입니다. 그 결과, 실제 암에 걸린 사람들이 물질 노출에 관해 더 쉽게 기억하고 사실적으로 보고하므로, 암은 특정 화확물질의 노출과 관련되어 나타난다고 말할 수 있습니다.
선택 오류는 조사 연구에 사람들이 의도적으로 지원한 겨웅 일어날 수 있는 오차입니다. 예를 들어 식단과 암의 위험도의 관계에 관한 연구를 생각해봅시다. 암에 걸린 사람들에게 이런 연구에 참여하는 것을 권유했을 때, 90%나 더 많은 사람들이 이에 동의하는 것에 반해, 대조군(암에 걸리지 않은 사람들)은 50%정도만 모집됩니다. 여기에는 이 대조군에 응한 50%의 사람들이 무작위가 아닐 것이라는 함정이 있습니다. 만약 암이 발병하지 않은 사람이 건강한 삶을 유지하고 있고 식이요법에 관심이 많아 자발적으로 지원자로 응했다면, 이는 암을 가진 사람들과 암을 가지고 있지 않은 사람들이 다른 식이요법을 보이는 선택 편견을 나타낼 수 있습니다. 그렇기 때문에, 선택 오류는 균형을 맞추지 못한 지원자의 수 때문에 지원자의 그룹이 일정한 특징을 지니게 되는 것을 조장합니다.
왜곡의 마지막 유형은 출판 오류라고 알려진 것으로, 과학저널에서 흔히 있는 일입니다. 저널은 어떤 인과관계를 찾으려다 실패한 연구자의 논문은 거의 추란하지 않습니다. 따라서 공업 지역과 청정 지역의 방광암발생률에 관한 20가지 다른 연구가 나와도 그중 19개는 두 도시간의 암발생률 차이를 밝혀내지 못하여 발행되지 못할 수 있습니다. 만약 20번째 연구가 공업지역의 방광암발생률이 높은 것을 통계적 유의성을 의미하는, 0.05 이하의 p값으로 밝혀냈다면, 이 하나의 명확한 연구가 출판되는 유일한 논문이 될지도 모릅니다. 그러나 한 가지 상기할 것은 p값이 0.05라는 것은 1/20인 5% 정도의 오류에 의해 오도되어 임의적 변동을 실제 값의 차이로 받아들일 수도 있음을 의미합니다. 이런 출판 오류로 인해 생성되는 문제는, 20건의 연구 중 오도될 소지가 있는 단 한 건의 연구 결과만이 출판되는 것입니다.
혼란요소들은 암을 유발하는 것으로 추정되는 물질들의 확인에 오류를 초래할 수 있습니다.
혼란현상도 암유발의심물질의 부정확하게 할 수 있습니다. 변동성 있는 혼란요소는 (1) 암 발달의 위험성에 영향을 주고 (2) 연구의 요소들과 어떤 식으로 연결되어 있습니다. 이 생각을 간단한 예로 구상해봅시다. 성냥을 운반하는 사람들이 폐암에 걸릴 확률이 높게 나타난 경우, 이는 성냥이 암을 유발한다는 것을 의미하지는 않습니다. 성냥을 운반하는 사람들이 더 쉽게 흡연을 즐길 수 있고, 이것이 암의 발생률을 증가시키는 진짜 이유입니다.
실제, 담배가 강력한 암유발물질이고 다양한 다른 행동양식이 흡연과 연관되어 있어, 흡연은 많은 역학조사에서 혼란요소로 작용합니다. 예를 들어 흡연자는 비흡연자들에 비해 음주도 더 좋아합니다. 그러믈 알코올과 암의 상관관계를 조사하는 연구는 혼란요소인 흡연을 제어하도록 디자인되어야 합니다. 만약 그렇지 않으면, 알코올 소비와 특정 암에 관련된 연구가 알코올보다는 담배에 의한 영향을 반영하게 될 수도 있습니다.
다른 중요한 변동성 있는 혼란요소는 연령입니다. 암의 발생률은 사람이 나이를 먹을수록 급격하게 증가합니다. 연령 차이가 나는 그룹의 어떤 물질에 대한 노출 정도는 작위적일 수 있아, 그에 대한 연구는 복잡해집니다. 예를 들어 어떤 특정한 처방약이 암을 유발하는지에 관해 연구하는 것에 관심이 있다고 해봅시다. 가장 수월한 접근은 그 약을 복용한 사람들의 암발생률과 복용하지 않은 사람의 암발생률을 가단히 비교해보는 것입니다. 그러나 이 자료는 두 그룹의 평균 연령의 차이로 인해 혼란을 야기할 수 있습니다. 특히, 나이가 많은 사람이 어린 사람들보다 더 많은 처방약을 복용한 사람들이 암발생률이 더 높다는 것을 발견했다면, 높은 안발생률은 단순히 처방약 복용자들의 높은 평균 연령을 반영한 것일 수도 있습니다. 따라서 연령보정 발생률을 사용함으로써, 비교하는 인구는 나이의 차이를 일치시키는 것에 신경을 써야 합니다. 만약 그렇지 않으면, 연령이 아니고 약 때문에 암발생이 증가했다고 결론 내리는 우를 범할 수 있습니다.