현재 위치 - 주공해몽공식사이트 - 점술 - 정확도는 한때 100% 였다! Tsinghua 동문 신은 미국 전염병 _ 과학 발명품을 예측합니다.

정확도는 한때 100% 였다! Tsinghua 동문 신은 미국 전염병 _ 과학 발명품을 예측합니다.

인생은 쉽지 않다, 사이드 쇼 는 한숨을 내 쉬었다. 난 단지 자신을 편안 하 게 정보를 쓸 수 있습니다. 오늘은 날씨가 좋아서 최신 정보를 보고 긴장을 풀기에 적합하다.

최근 미국과 유럽의 전염병에 대한 하나님의 예측에 관한 일일 블로그가 인터넷에서 인기를 끌고 있다.

얼마나 신기한가? 두세 가지 예를 들면 다음과 같다.

-3 월 27 일부터 10 일 블로그의 미국 감염자 예측 정확도는 90% 이상, 4 월 4 일 정확도는 100% 에 육박했다.

-3 월 3 1 일 블로그는 미국 전염병이 200 만명 이상 검출된 경우 8- 10 일 이내에 절벽이 떨어질 것으로 전망했다. 7 일 뒤인 4 월 6 일 미국의 전염병 수치는 절벽식 하락으로 상승폭이 12.43% 에서 8. 13% 로 떨어졌다. 이 글은 엄청난 반향을 불러일으켜 독서량이10.340,000 을 넘어섰다.

-3 월 27 일 이후 유럽 감염자 수의 일일 예측 정확도는 97%, 4 월 5 일 전 예측 정확도는 100% 에 육박했다.

이지빈은 미국 감염자 수에 대한 예측 정확도가 90% 에 달한다

이에 대해 네티즌들은 "대신, 바이러스가 네 말을 들어라, 절대적이다" 고 논평했다.

알다시피, 코로나 전염병의 발발은 정치, 경제, 지리 등 많은 복잡한 요소들을 포함하는 세계적인 주요 공공사건이다. 구체적인 인원수를 예측하는 것은 터무니없는 것처럼 들리고, 정확도는 현학이다. 그래서 이 블로그 뒤의 블로거는 당대 신산자라고 할 수 있다.

그렇다면 이 신산자는 어떻게 정련된 것입니까?

청화대 졸업생 +8 년 시장 예측 경험.

이 블로그 뒤에 있는 블로거, 신산자 본인, 이지빈이라고 합니다.

이지빈, 1980- 1985 청화대 컴퓨터학과에서 공부하고, 1985- 1994 는 중국과학원에서 공부하고 있습니다. 30 세에 부연구원, 제품부 주임, 주임 조수로 일하다. 1994 뉴질랜드로 이주하여 홍콩에 정착했다. 현재, 홍콩 zhijia 물류 소프트웨어 유한 회사

이지빈 블로그 스크린 샷

이지빈이 있는 두 회사 중 전자의 주영 업무는 물류 시스템 개발이다. 후자는 홍콩 중문대 배경을 가지고 있으며, 주영 업무는 시장 수요 예측이다. 즉, 기업에 특정 지역의 향후 3 ~ 6 개월 동안의 제품 수요와 가격 변동에 대한 데이터 분석과 예측을 제공하는 것이다.

이지빈은 그가 20 12 에서 데이터 분석과 예측 분야에 진입했다고 말했다. 이경사의 홍콩 중문대 배경으로 이지빈도 교수로부터 많은 것을 배웠다.

또한 기술적 관점에서 볼 때, 칭화대 컴퓨터학과에서의 이지빈의 학습 경험은 소프트웨어 모델링과 빅 데이터 분석에 대한 완전한 지식 체계를 형성하게 했다. 한편 칭화대학의 학풍과 이공계 배경도 그가 결론보다는 데이터, 증거, 사례에 더 많은 관심을 기울이게 했다.

이 모든 것을 합치면 이지빈이 데이터에 매우 민감하게 된다.

지난해 말과 올해 초, 우한 (WHO) 가 병례 보고를 시작했고, 홍콩에도 코로나 환자가 의심돼 홍콩에 오래 살던 이지빈이 경각심을 불러일으켰다. 2020 년 6 월 7 일, 홍콩 특별 행정구 정부에 의해 코로나 (WHO) 가 법정 전염병으로 선포되자 전염병 수치가 공개되기 시작했다. 이에 이지빈은 코로나 관련 자료를 추적하기 시작했다.

그 후로 이지빈은 매일 아침 일어나 집중된 데이터를 수집했다. 처음에는 우한, 호북, 홍콩의 데이터일 뿐, 나중에는 대륙의 다른 곳의 데이터였다. 6 월 말 5438+ 10 월까지 해외 데이터 수집을 시작하여 Excel 양식으로 정리했습니다. 또한 자신의 전문성을 활용하여 데이터를 모델링하고 뉴스의 데이터와 결합하여 공식 통보된 데이터를 분석하고 판단하기 시작했습니다.

처음에는 이지빈이 청화의 급우들 사이에서만 데이터와 관점을 공유했고, 이후 매일 30 분 동안 블로그를 쓰고 시나닷컴 블로그에 게재했다. 오늘날, 이것은 이미 일상적인 습관이 되었다.

물론 이지빈의 경우, 정규 데이터를 수집, 정리, 분석하는 것 외에도, 그는 자신의 전문 지식을 결합하여 데이터 모델을 구축하고 있으며, 이 모델의 매개변수를 지속적으로 보완하고 검증하여 원하는 효과를 얻고 있습니다.

이지빈은 27 일 안정적 데이터 모델을 바탕으로 처음으로 미국 감염 상황에 대한 예측 데이터를 제시했다. 3 월 28 일, 그는 유럽 감염에 대한 예측 수치를 제시했다.

이지빈은 유럽 감염자 수에 대한 예측 평균 정확도가 97% 에 달한다

그의 예측에는 감염 건수뿐만 아니라 감염 증가율, 러시아워 시간, 총 감염 수, 사망자 수, 사망률 등의 수치가 나와 있다. 물론 감염자 수는 그가 예측의 정확성을 측정하는 데 사용하는 가장 중요한 지표이다.

이지빈 자신도 그의 예측 수치가 이렇게 정확할 줄은 몰랐다.

하지만 이지빈은 1 000% 로 미래를 정확하게 예측할 수 있는 사람은 아무도 없고 예측은 스크롤해야 한다고 강조했다.

그는 예측은 역동적인 과정이라고 말했다. 인스턴트 조치나 사건과 같은 예상치 못한 많은 요소들은 예측할 수 없기 때문이다. 이 시점에서 이러한 돌발사건과 의사결정을 매개변수 조정으로 변환하고 예측 모델에 피드백하여 더 정확하게 작동하도록 해야 합니다. 나의 예측 모델과 예측 매개변수도 끊임없이 개선되고 있다.

아무리 좋은 소프트웨어라도 100% 의 정확한 예측을 할 수 없다.

이지빈의 예측은 두 가지 핵심 요소인 데이터와 예측 모델과 불가분의 관계에 있다.

첫 번째는 데이터의 신뢰성입니다. 인터뷰에서 이지빈은 6 월 5438+ 10 월부터 매일 데이터를 수집했다고 말했다. 처음에는 우한, 홍콩에만 데이터가 있었고, 지금까지 그녀는 매일 수백 개 국가와 지역의 데이터를 수집했다.

이지빈은 데이터 수집 및 분석 과정에서 데이터 충돌의 발생을 식별해야 한다고 강조했다. 특히 공식 통보된 데이터의 양이 많은 경우 뉴스 데이터를 포함한 여러 가지 방법을 사용하여 지역별 데이터 간에 발생할 수 있는 데이터 충돌을 점검합니다. 데이터 충돌이 많을수록 데이터 신뢰성이 낮아집니다.

동시에 데이터 신뢰성을 판단하는 과정에서 데이터 게시 속도에 따라 달라집니다. 데이터 게시 빈도가 높을수록 신뢰성이 높아지고 남아시아와 동남아시아가 발표한 데이터가 적을수록 신뢰성이 떨어집니다.

전염병은 미국 CDC 홈페이지에서 온 것이다.

또한 데이터의 신뢰성을 판단할 때 뉴스 데이터를 빌려 비교할 수 있습니다. 이지빈이 뇌봉에게 말했다. Com 은 의사와 환자의 비율이 상대적으로 안정적이기 때문에 뉴스 보도의 의료진 수에서 환자 수를 추정할 수 있다고 생각한다.

그는 사실 모든 데이터에 인적 오차나 통계 오차가 있을 수 있고, 한 지역의 신뢰도는100% 라고 말했다. 그러나 상대적으로 미국은 데이터 충돌이 적고 유럽의 데이터 신뢰성은 미국보다 낮다. 서유럽 동유럽의 불균형으로 평균을 낼 것이다. 인도, 동남아시아, 일본의 데이터에는 데이터 게시가 느리고 데이터 충돌이 많아 데이터 신뢰도에 영향을 미치는 설정과 같은 문제가 있는 것 같습니다.

이지빈은 2 월 말까지 국내 데이터 모델링 검증을 바탕으로 미국과 유럽의 전염병 수치를 예측하기 시작했다. 따라서 이 데이터를 바탕으로 이지빈은 예측 모델을 만들었습니다. 사실 이 모델은 매우 복잡하며, 합치면 수백 개의 매개변수가 있는데, 여기에는 20 ~ 30 개의 중요한 매개변수가 포함되어 있으며, 다음과 같은 세 가지 범주로 나뉜다.

첫 번째 범주는 다양한 유행 매개 변수의 확진환자 수, 인구 수, 일일 신규 확진환자 수, 의사환자 수, 일일 체크 아웃 사례 수, 사망 사례 수, 치료 사례 수, 입원 환자 수, 입원 환자 수 등이다.

두 번째 유형의 매개변수는 도시 유형, 인구 밀도, 기온, 날씨, 도시 60 세 이상 노인의 비율, 도시 평균 연령, 도시 건설 등과 같은 지역/도시/국가의 특성과 관련이 있습니다.

세 번째 매개 변수는 자원 및 거버넌스 능력, 의료 자원, 병원 침대 수, 사회 조직 능력, 정보 투명성, 관리 방식 등에 관한 것입니다.

이지빈은 실제 운영 과정에서 일반적으로 Excel 을 사용하여 데이터를 수집한 다음 백그라운드 데이터베이스를 가져온 다음 자신이 개발한 소프트웨어 모델을 사용하여 세 가지 결론을 도출한다고 말했다. 결국 그는 인위적으로 결과를 판단할 것이다. 그는 사회적 감정과 같이 정량화할 수 없는 많은 매개변수들이 있다고 강조했다. 그래서 사람들은 참여해야 합니다.

그는 또 아무리 좋은 소프트웨어라도 100% 정확하게 예측할 수 없다고 말했다.

큰 배와 작은 배가 동시에 빙산을 만났을 때

청화대를 졸업한 이지빈은 데이터 분석을 뛰어넘는 통찰력과 사고를 가지고 있다.

예를 들어, 모델링 과정에서 이지빈은 국내 데이터로 시작하는데, 이는 이지빈의 모델링 과정에 중요한 영향을 미쳤을 뿐만 아니라, 그로 하여금 약간의 관찰을 하게 했다. 그래서 봉성 전날, 그는 칭화 80 의 급우들과 두 가지 생각을 나누었습니다.

첫째, 데이터 상승이 너무 무섭기 때문에 우한 즉시 폐쇄해야 합니다.

둘째, 호북, 특히 우한 (WHO) 에 20 ~ 30 개의 그리드 야전병원을 신속히 설립하여 격리치료센터, 이른바 야전병원, 즉 이후 방석병원으로 삼았다. 전염병의 발전이 너무 치열하기 때문에 환자를 격리하는 것이 치료보다 더 중요한 예방 조치이다.

이런 생각들은 학우들 사이에서 많은 토론을 불러일으켰고, 물론 의문과 반대의 목소리도 있었지만, 더 많은 학생들의 적극적인 참여로 더 좋은 생각과 건의를 많이 제기하여 많은 유익을 얻었습니다. 나중에 이러한 생각들이 타당하다는 것을 증명하고 공식 후속 조치의 검증을 받았다. 이 가운데 야전병원에 대한 구상이 2 주 앞당겨졌다.

위의 제안들 외에도 이지빈은 데이터 분석과 모델 구축 과정에서 폭발점이 된 도시에 몇 가지 특징이 있는 것으로 드러났다.

구시가지

기후가 습하다

기온 5- 15 도

하수 시스템 노화;

노인의 비율이 높다.

흥미롭게도, 중국의 우한, 한국의 대구, 이탈리아의 밀라노, 이란의 테헤란, 미국의 뉴욕 등 여러 나라의 전염병 도시는 일반적으로 이러한 특징에 부합한다.

이 특징들의 귀인에 대해서는 이지빈이 개인의 주관적이고 합리적인 추측이 섞여 있다고 강조했지만, 일련의 결과 검증을 거쳐 결국 예측 결과에 반영되었다.

그는 또한 매개 변수에서도 사회 조직 모델, 관리 모델, 사회 정보 투명성 등의 문제가 관련되어 있기 때문에 예측에서도 결과를 비관적이거나 낙관적으로 설정할 것이라고 밝혔다.

이지빈이 4 월 4 일 내놓은 비관적 예측 결과에 따르면 미국 감염자 수에 대한 전반적인 예측 정확도는 96% 에 달했다.

이지빈은 미국 감염자 수에 대한 예측 정확도가 96% 에 달했다

그러나 독점 인터뷰에서 이지빈은 인간의 참여에도 불구하고 의사 결정에서 데이터의 절대적 지위를 강조했다. 그는 전염병을 고려하지 않아도 일상적인 의사 결정 과정에서 데이터의 중요성은100% 라고 할 수 있다고 말했다. 이 수치들은 진실해야 할 뿐만 아니라, 전면적으로 투명해야 한다. 후속 프로세스에 참여하는 사람도 이러한 데이터를 기반으로 하는 데이터이며 의사 결정의 기초입니다.

그렇다면 데이터 기반 의사 결정의 적용 범위는 무엇입니까?

이지빈은 정치, 경제, 기타 복잡한 사회적 요인을 포함한 우연한 코로나 전염병도 예측할 수 있다고 생각한다.

그는 전염병과 비슷한 상황에서 그 발전에는 특정한 패턴이 있다고 말했다. 가끔 규칙적으로, 우리는 100% 의 정확한 법칙을 파악하지 못할 수도 있지만, 일정한 비율의 법칙에 따라 우리는 여전히 판단과 결정을 내릴 수 있다. 물론, 전제는 엄청난 양의 유효 데이터입니다.

이에 따라 이지빈은 재미있는 비유도 언급했다.

큰 배 한 척과 작은 배 한 척이 갑자기 빙산을 만나면 반드시 모퉁이를 돌 것이다. 그러나 상대적으로 큰 배의 결말은 분명히 더 예측할 수 있다. 작은 배는 단번에 바뀌었지만 큰 배는 너무 커서 관성이 있어 빙산에 부딪히기 쉽다. 이 관성은 법칙이고, 배의 부피는 그 자체로 데이터량이다.

데이터 양이 많을수록 데이터가 정확하고 관련 정보가 투명할수록 예측하기가 쉬워지고 이런 집단성 사건의 발생을 예측하는 것이 더 정확해진다. 이지빈은 마지막으로 말했다.

정확도는 한때 100% 였습니다! 더 많은' 청화교우 신이 미국 전염병을 예측한다' 는 정보를 계속 주시해 주시기 바랍니다. 딥 스페이스 테크놀로지 정보란에 계속 주목해 주시기 바랍니다. 딥 스페이스 사이드쇼는 계속해서 더 많은 기술 뉴스를 업데이트해 드릴 것입니다.

출처: 딥 스페이스 게임 편집자: 익명 왕의 마음 2 클릭