정보 세탁 시대에 '헛소리 부르기'가 중요한 이유
잘못된 정보와 잘못된 정보가 데이터 중심 세계에 만연해 있어 이제는 모든 시민이 의심을 품고 문제를 제기할 의무가 있습니다.

이 매력적인 책은 광고된 대로 숫자가 스스로 말하지는 않지만 조정될 수 있다는 소식을 전하며 다음 주 화요일에 출간될 예정입니다. 그러나 출판사는 전염병이 발발했을 때 질병의 진행 상황, 공중 보건 대응의 완전한 혼란, 당신이 감염될 가능성, 그리고 날씬한 것을 묘사하는 모호한 데이터에 기초한 그래프와 그래프를 언론에 급히 보냈어야 했습니다. 당신이 죽을 확률의 일부가 매일 첫 페이지에 나타나기 시작했습니다. 상황은 계속 바뀌었고 결론은 확실하게 다르며 데이터에 대한 믿음을 잃도록 촉구하는 능력에서만 통합되었습니다. 워싱턴 대학에서 정보 과학을 가르치는 웨스트와 버그스트롬은 믿음이 낡은 모자라는 것을 상기시킵니다. 무슨 일이 일어나고 있는지 정확히 알기 위해서는 데이터와 데이터 조작을 스스로 평가할 수 있어야 합니다. 의외로 쉽습니다.
우리가 고등학교에 다닐 때 통계와 확률은 종종 조작되는 표준인 p-값에 의존하는 부정확한 수학 분야로 스니핑되었습니다. 당신이 경제학을 공부하고 세상을 보고 싶어하지 않는 한, 당신은 그것에 시간을 낭비하지 않았습니다. 평균, 중앙값, 최빈값, 표준 편차, 순열 및 조합, 파스칼에 대한 의식적인 끄덕임, 그리고 계속 진행했습니다. 컴퓨터가 당신을 매료시켰다면 부울 대수학으로, 다른 모든 것에 대해서는 삼각법과 미적분학으로. 통계가 인간사를 이해하는 데 가장 중요한 기술이 될 것이라고 누가 생각이나 했겠습니까?
빅 데이터 및 머신 러닝 시대에 데이터 세트의 엄청난 크기와 알고리즘의 불가해성으로 인해 문제가 증폭되는 것으로 보입니다. 움직임은 알고리즘의 투명성을 추구합니다. 컴퓨터에 의해 넘어졌다면 그 이유를 알아야 합니다. 그러나 목표는 달성하는 것보다 더 쉽습니다. 머신 러닝은 사람이 분류한 데이터 세트에 대해 학습하고 미래 데이터를 분류하는 프로그램을 작성합니다. 그러나 시스템 작성자조차도 그것이 어떻게 작동하는지 정확히 알지 못할 수 있습니다. 이 책은 허스키와 늑대의 사진을 분리하는 작업을 수행하는 ML 시스템을 참조합니다. 그러나 그것은 동물이 아니라 배경을보고있었습니다. AI는 허스키가 다양한 인간 상황에서 촬영될 수 있지만 야생 늑대는 눈 배경에서 촬영될 가능성이 가장 높다는 것을 깨달았습니다. 배경만 보고 가짜지만 정확하게 동물을 식별했다.
게다가, 대부분의 알고리즘은 정당한 이유가 있습니다. Google이 순위 알고리즘을 공개적으로 발표하면 모든 사람과 십대 조카가 게임을 하려고 함에 따라 전 세계적인 군비 경쟁이 촉발될 것입니다. 그러나 저자들은 일반적으로 알고가 살고 있는 블랙박스에 들어갈 필요가 없다는 것을 상기시킵니다. 입력 및 출력의 품질을 분석하는 것은 단순한 논리만 필요하며 목적에 부합합니다.
코로나바이러스와 첫 페이지에 있는 구불구불한 그림과 도표, 그리고 설명자가 인류를 통해 그 파괴적인 여정을 매핑한 것으로 돌아가 봅시다. 일관성이 없는 경우, 전면 유리 와이퍼를 쓸어넘기는 것처럼 마스크의 완전한 무의미함과 격리에서의 중요한 역할 사이에서 의견이 바뀌면서 마스크의 필요성에 관한 기이한 난관을 생각해 보십시오. 가장 창피하게도 항상 글로벌 의제를 현명하게 설정해 온 WHO가 불확실성을 부추겼고, 승인된 버전과 과학 자체의 신뢰성에 대한 대중의 신뢰를 훼손했습니다.
그리고 그래프, 차트 및 데이터 시각화의 이 파라고(Pace Tharoor)가 있었습니다. 여기에서도 저자는 간단한 확인을 제공합니다. 척도는 원근감의 원점인 0에서 시작합니까, 아니면 명백한 결과를 편리하게 조정할 수 있는 임의의 숫자에서 시작합니까? 눈금이 선형입니까, 아니면 1cm가 처음에는 1년을 나타내고 이후에는 10년이 가파르게 곡선을 나타냅니까? 중요한 변경 사항이 보이지 않을 정도로 타임스케일이 축소되었습니까? 저자는 예를 들어 데이터를 표현하기 위해 포크의 타인을 사용하여 농장 간 이야기를 설명함으로써 그래픽 표현을 성별로 구분하는 것에 대해 격렬하게 반대합니다. 인간은 매우 시각적인 동물이며 그래프를 조정하는 것이 인간을 잘못된 길로 이끄는 가장 쉬운 방법입니다.
이 책은 당신을 심각하게 괴롭히는 무언가에 대해 무언가 진지하게 행해지고 있다는 인상만을 전달하는 구식 BS를 구분합니다(1980년대 인도, 고위급의 직접적인 감독하에 전쟁 기반에 대한 행동 계획의 즉각적인 구현). - 은퇴한 대법원 판사가 이끄는 위원회와 수학, 과학 및 통계의 언어를 사용하여 엄격함과 정확성의 인상을 주는 새로운 학교 학사. 그것이 너무 만연해서 그것을 책임감 있게 외치는 것이 공공의 의무가 되어야 합니다.
선전의 수혜자들은 정치적 성향이 있는 경우에만 전자를 믿지만 후자에 대해서는 무력합니다. 이 종은 자신이 수치적으로 문제가 있다고 믿으며, 아무리 명백하게 거짓되거나 오해의 소지가 있더라도 데이터에 직면하면 비참하게 항복합니다. 슬프게도, 그 숫자는 결코 스스로를 대변하지 않습니다. 이제 왜곡된 데이터가 너무 만연해 있어 정보화 시대의 불굴의 갈리아인인 팩트 체커는 더 이상 스스로의 흐름을 막을 수 없습니다. 우리 모두가 디지털 플로깅을 할 때입니다.
친구들과 공유하십시오: