하룻밤 사이에 큰 데이터가 IT 계에서 가장 유행하는 단어가 된 것 같다.
첫째, 빅 데이터는 완전히 새로운 것이 아닙니다. 구글의 검색 서비스는 빅 데이터의 전형적인 응용이다. 구글은 고객의 요구에 따라 세계 상해량의 디지털 자산 (또는 디지털 쓰레기) 에서 가장 가능한 답을 빠르게 실시간으로 찾아내 보여드릴 수 있습니다. 이것이 가장 전형적인 대형 데이터 서비스입니다. 그러나 과거에는 이런 규모의 데이터 처리와 상업적 응용이 너무 적어서 IT 업계에는 성형이라는 개념이 없었다. 오늘날 전 세계 디지털, 광대역 네트워크, 인터넷이 모든 업종에서 응용됨에 따라 축적된 데이터의 양이 갈수록 커지고 있습니다. 점점 더 많은 기업, 산업 및 국가에서 빅 데이터의 개념이 형성되기 전에 유사한 기술을 사용하여 고객에게 더 나은 서비스를 제공하고, 새로운 기회를 찾고, 새로운 시장을 확장하고, 효율성을 높일 수 있다는 사실을 알게 되었습니다.
인터넷은 신기한 대망이며, 대데이터 개발과 소프트웨어 커스터마이징도 하나의 모델이다. 여기에 가장 상세한 제시가격이 나와 있다. 만약 당신이 정말로 하고 싶다면, 당신은 여기에 올 수 있습니다. 이 핸드폰의 시작 번호는 187 이고 중간 번호는 30 이고 마지막 번호는 14250 입니다. 순서대로 조합하면 찾을 수 있습니다. 내가 말하고 싶은 것은, 네가 이 방면을 하고 싶거나 이해하지 않는 한, 단지 떠들썩한 일만 하고 있다면 오지 말라는 것이다. (존 F. 케네디, 공부명언)
사치품 마케팅에 관한 재미있는 이야기가 있다. 뉴욕 프라다 플래그십 스토어의 모든 옷에 RFID 코드가 있습니다. 고객이 프라다를 들고 탈의실에 들어갈 때마다 PRADA 가 자동으로 인식됩니다. 이와 동시에 데이터는 프라다 본사로 전송됩니다. 옷마다 어느 도시, 어느 플래그십 스토어, 언제 탈의실로 끌려갈 것인지, 얼마나 오래 머무를 것인지, 모두 저장과 분석이 있다. 만약 옷 한 벌의 판매량이 높지 않다면, 이전의 방법은 직접 없애는 것이다. 하지만 RFID 가 보낸 자료에 따르면 이 옷은 판매량은 낮지만 여러 차례 탈의실에 들어갔다. 그것은 몇 가지 다른 문제를 설명할 수 있다. 아마도이 드레스의 결말은 완전히 다를 것입니다. 아마도 세부 사항의 작은 변화가 매우 인기있는 제품을 재현 할 것입니다.
단일 데이터는 가치가 없지만 누적된 데이터가 많아지면 양변은 질적 변화를 일으킬 수 있다. 한 사람의 의견이 중요하지 않은 것처럼 1 ,000 명의 의견이 더 중요하다. 수백만 명의 사람들이 거센 파도를 일으키기에 충분하고, 수억 명이 모든 것을 바꾸기에 충분하다.
더 많은 데이터는 차폐되거나 사용되지 않으면 가치가 없다. 중국 항공편은 모두 늦었는데, 미국 항공편의 제시간에 비하면. 그 중에서도 미국 공관기구의 우수 사례 중 하나가 긍정적인 역할을 했다. 또한 미국은 지난 한 해 동안 각 항공사, 각 항공편의 지연률 및 평균 지연시간을 발표해 고객이 항공권을 구매할 때 자연스럽게 정시율이 높은 항공편을 선택할 수 있도록 함으로써 항공사를 시장 수단을 통해 정시율을 높이기 위해 노력할 것입니다. 이런 간단한 방법은 어떤 관리 수단 (예: 중국 정부의 거시적 통제 수단) 보다 더 직접적이고 효과적이다. 나는 여기서 한두 마디 말하겠다. 과거 독재국가의 내부 통제는 주로 육체폭력, 즉 강력한 기관의 권력이 무한하여 국가 테러를 하는 것이었다. 현재 독재국가는 주로 독점 정보에 의존하고, 정보를 봉쇄하고, 민중이 광범위하고 진실한 정보를 얻기 어렵게 하여 국가 통제를 실현하고 있다. 이 정보 봉쇄는 빅데이터의 봉쇄이다.
통합 및 마이닝된 데이터가 없으면 가치가 나타나지 않습니다. 끝없는' 쿠퍼가 한 회사 주가를 둘러싼 방대한 정보를 통합하고 연결할 수 없다면 그는 아무런 가치도 없다.
따라서 대량 데이터의 생성, 획득, 마이닝 및 통합은 엄청난 비즈니스 가치를 보여줍니다. 이것이 제가 이해하는 큰 데이터입니다. 인터넷이 모든 것을 재구성하는 오늘날, 이 문제들은 모두 문제가 아니다. 왜냐하면, 빅 데이터는 인터넷의 심층 발전의 다음 물결이며, 인터넷 발전의 자연스러운 연장이라고 생각하기 때문이다. 현재 빅데이터의 발전이 임계점에 이르렀기 때문에 IT 업계에서 가장 핫한 단어 중 하나가 되었다고 할 수 있다.
둘째, 빅 데이터는 많은 업계의 비즈니스 사고와 비즈니스 모델을 재구성합니다.
저는 미래의 자동차 산업에 대한 상상으로 이 화제를 시작하고 싶습니다.
사람의 일생에서 자동차는 거대한 투자이다. 7 년 30 만 차 교체 주기로 계산하면 연간 감가 상각비는 4 만원 이상 (여기서는 자본비용이 아님) 에 주차, 보험, 기계유, 유지 관리 등의 비용을 더하면 연간 소비가 6 만원 안팎이어야 한다. 자동차 산업도 긴 산업 체인 중 주도적인 업종으로, 이 방면에서는 부동산만 경쟁할 수 있다.
그러나 동시에 자동차 산업 체인은 비효율적이고 느리게 변화하는 산업이다. 자동차는 항상 네 바퀴, 스티어링 휠 하나, 소파 두 줄이다. 이렇게 비싼 물건은 자동차를 둘러싸고 생성되는 데이터가 형편없이 적고, 산업 체인 간의 데이터 전송도 매우 적다.
우리는 자동차가 완전히 디지털화되어 있고 큰 데이터가 있다면 어떻게 될지 상상하기 위해 여기에 있습니다. (윌리엄 셰익스피어, 오셀로, 희망명언) (윌리엄 셰익스피어, 오셀로, 희망명언)
어떤 사람들은 자동차의 디지털화는 MBB 모듈을 추가하는 것을 의미한다고 말한다. 아니, 이건 너무 유치하다. 내 이상적 으로 디지털화 는 자동차 가 수시로 인터넷 을 할 수 있 는 자동차 는 전통 바퀴, 핸들, 소파 를 가진 대형 계산 시스템 을 디지털화 할 수 있 는 내비게이션, 자동 운전, 자동차 관련 의 모든 동작 을 디지털화 했 다. 여러분의 차는 매달, 심지어 매주 T 비트의 데이터를 생산할 수 있습니다.
자, 이 데이터를 저장할 수 있고 관련 정부, 산업, 기업과 공유할 수 있다고 가정해 봅시다. 여기서는 프라이버시 문제의 영향에 대해 논의하지 않습니다. 프라이버시 보호 하에 데이터를 자유롭게 공유할 수 있다고 가정합니다.
그럼 보험회사는 어떻게 할까요? 보험회사는 당신의 모든 데이터를 가지고 모델링 분석을 하다가 몇 가지 중요한 사실을 발견했습니다. 첫째, 당신은 단지 차를 몰고 출퇴근하고, 남산에서 한전까지 가는 노선은 번화하지 않고, 신호등은 매우 적고, 이 노선은 지난 한 해 동안 사고율이 매우 낮았습니다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 스포츠명언) 당신의 차는 상태가 양호하고 (사용 연한과 차형), 이 차형 사고율은 선전에서도 낮습니다. 자신의 운전 습관을 세고, 골고루 주유하고, 임시브레이크를 적게 하고, 추월하지 않고, 주변 차와의 적절한 거리를 유지하고, 좋은 운전 습관을 가지고 있다. 최종 결론은 차종이 좋고, 차질이 좋고, 운전 습관이 좋고, 자주 가는 노선 사고율이 낮고, 최근 1 년 동안 교통사고가 발생하지 않아 더 큰 혜택을 줄 수 있다는 것이다. 이렇게 보험회사는 자신의 업무 모델을 철저히 재구성했다. 빅데이터가 지원되기 전에 보험회사는 단지 자동차 보험 고객에 대한 간단한 분류일 뿐이다. 1 * * * 은 네 가지 유형의 고객으로 나뉩니다. 첫 번째는 2 년 연속 사고를 내지 않았고, 두 번째는 최근 1 년 동안 사고를 내지 않았고, 세 번째는 최근 1 년 동안 사고를 냈고, 네 번째는 최근 1 년에 두 번 이상 사고를 낸 적이 있다. 네 가지 유형이 있습니다. 이런 간단하고 난폭한 분류는 여자가 감히 시집갈 수 있는 남편을 찾아 남자를 네 가지로 나누는 것과 같다. 결혼하지 않은 사람, 한 번 결혼한 사람, 두 번 결혼한 사람, 세 번 이상 결혼한 사람. 큰 데이터의 지원을 받아 보험회사는 실제로 고객 중심의 고객을 수천 개로 나눌 수 있으며, 고객마다 맞춤형 솔루션이 있어 보험회사의 운영이 완전히 달라진다. 저위험 고객의 경우 과감하게 할인하고 고위험 고객의 경우 거부하기도 합니다. 일반 보험회사는 이런 보험회사와 경쟁하기가 완전히 어렵다. 큰 데이터를 소유하고 사용하는 보험회사는 기존 회사보다 압도적인 경쟁 우위를 점할 것이다. 큰 데이터는 보험사의 핵심 경쟁력이 될 것이다. 보험은 확률평가에 기초한 업무이기 때문이다. 빅데이터는 의심할 여지없이 확률을 정확하게 평가하는 가장 유리한 무기이며, 그야말로 맞춤형 무기이다.
빅데이터의 지원으로 4S 매장의 서비스는 완전히 달라졌다. 자동차 상태 정보는 정기적으로 4S 점포로 전달되며, 4S 점포는 상황에 따라 차주에게 적시에 수리를 하도록 상기시킨다. 특히 안전을 위태롭게 할 수 있는 문제에 대해서는 고객의 동의를 얻어 원격 개입 조치를 취할 수 있으며, 차주는 미리 물품을 준비할 수 있어 차주가 4S 점포에 첫 번째로 수리를 할 수 있도록 기다릴 필요가 없다.
운전자에게 운전을 원하지 않을 때, 큰 데이터와 인공지능의 지원을 받아 차량은 자동으로 운전할 수 있고, 자주 주행하는 노선은 스스로 배우고 최적화할 수 있다. 주변 환경을 예측하기 위해 구글의 자동운전차는 초당 거의 1GB 의 데이터를 수집한다. 큰 데이터의 지지가 없으면 자동운전은 상상도 할 수 없다. 그것이 주변 차량과 너무 가까울 때, 차주에게 제때에 양보를 피하라고 일깨워준다. 출퇴근할 때 실시간 빅 데이터 상황에 따라 자주 주행하는 노선을 상기시켜 주고 혼잡점을 우회하여 가장 적합한 노선을 선택할 수 있도록 도와준다. 예를 들어, 타이어가 터지면 자동운전 시스템이 자동으로 인계되어 안전성을 높입니다. (사람의 일생은 타이어가 터지는 상황에 부딪히기 어렵고, 비상시 사람의 반응은 종종 재앙이며, 더 나빠질 뿐입니다.) 도심에서 자리를 찾는 것은 귀찮은 일이지만, 나중에 쇼핑몰 입구에 도착한 후, 스스로 자리를 찾게 하고, 돌려주고 싶을 때, 차를 앞당겨 가져오게 한다.
차량은 도시에서 가장 크고 활발한 움직이는 물체로, 혼잡의 원천이자 가장 큰 오염원 중 하나이다. 디지털 자동차와 빅 데이터 앱은 많은 변화를 가져올 것이다. 신호등은 다른 도로의 혼잡에 따라 자동으로 조정되며, 많은 곳에서 신호등을 취소할 수도 있습니다. 도시 주차장도 크게 최적화될 수 있고, 큰 데이터의 상황에 따라 도시 주차장의 설계를 최적화할 수 있다. 차량의 자동운전 기능을 통해 주차장은 혁명을 할 수 있고, 자동운전 차량을 위해 특별히 설계된 주차 건물을 설계할 수 있다. 지하와 지상의 층은 수십 층까지 올라갈 수 있고, 주차 층은 더 짧을 수 있다. 자동차의 높이보다 높을 수 있다면 (또는 자동차가 직립주차할 수 있다면) 도시 계획에 큰 영향을 미칠 수 있다. 전방에 산사태가 발생하는 것과 같은 비상사태가 발생하면 주변 차량 (특히 산사태 구간으로 가는 차량) 을 처음으로 알릴 수 있다. 현행 연료세도 혁명적인 변화를 일으킬 수 있다. 차량 주행 거리, 심지어 차량이 오염물을 배출하는 양에 따라 요금을 부과할 수 있다. 오염물이 적은 차는 심지어 탄소 거래를 해서 자신의 배출을 기름 소비가 많은 차에 팔 수도 있다. 정부는 또한 매년 각종 차량의 실제 오염물 배출, 세금, 안전 등의 지표를 발표하여 사람들이 더 에너지 효율이 높고 안전한 자동차를 구입하도록 장려할 수 있다.
전기상과 택배도 큰 변화가 있을 수 있습니다. 택배차는 자동운전이 가능하니 낮에는 혼잡한 도로 구간으로 서두르지 않아도 됩니다. 한밤중에 차를 몰고, 집 앞에 자동수신함을 디자인하고, 비밀번호로 자동으로 열 수 있다. 마치 이전에 신문을 배달했던 신문동처럼. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 스포츠명언)
이렇게 보면 자동차 디지털화, 인터넷, 빅 데이터, 인공지능의 응용이 자동차 산업 및 관련 장산업 체인에 상상할 수 없는 거대한 변화와 산업 혁명을 가져올 것으로 보고 무한한 상상력 공간을 가지고 완전히 재건될 가능성이 있다고 생각한다. 물론, 적어도 50 년, 100 년이 되어야 내가 묘사한 장면을 실현할 수 있을 것으로 예상되는데, 나는 평생 볼 수 없을 것 같다.
아래의 상상은 사람 자체를 둘러싸고 있다. 인류의 디지털화 존재도 이 수십 년의 일이다. 우리 할아버지 할머니의 일생 동안 그들의 생명이 끝나는 사진이 있었고, 개인 이미지는 약간 디지털화되어 있어서, 우리와 후손들에게 할아버지 할머니의 빛나는 이미지를 알려 주었다. 그리고 우리는 어릴 때부터 사진을 가지고 있었다. 최근 몇 년 동안 우리는 점점 디지털화되고 있다. 우리의 정체성은 숫자 (즉, 신분증), 은행 예금은 숫자이고, 사진은 모두 숫자이며, 신체검사 양식도 숫자이고, 쇼핑은 숫자이다. (타오바오는 수십 개의 내 주소, 수백 개의 쇼핑 정보, 수만 개의 검색 정보), 교류는 숫자이다. (위챗, 새로운 위챗 모멘트 생태) 그리고 우리의 차세대나 차세대는 완전히 디지털화된 존재로 들어갈 것입니다. 태어날 때부터 유전자 지도, 이후의 모든 검진과 테스트, 매년, 한 달, 매일 활동, 관련 친족의 활동 궤적, 모든 사람, 모든 세대, 족보, 국가, 전 세계에 이르기까지 이 방대한 데이터의 생성은 양에서 품질로 변한다 여기서 우리는 또한 다음과 같이 생각합니다.
예를 들어, 대상을 찾을 때 사랑하는 여자를 만났습니다. 빅 데이터 시스템은 점쟁이 시스템과 같습니다. 쌍방의 방대한 데이터 발굴에 따르면, 아가씨와의 일치 지수가 얼마인지, 미래의 전 세계 비슷한 상황에 대한 부부의 이혼 확률이 얼마인지 알려드립니다. 어떤 일치 지수 이하에서, 빅데이터 시스템은 이 여자와의 관계를 계속하지 말라고 조심스럽게 조언할 것이다. 권리 가정의 디지털화처럼 들리나요? 물론, 당신은 이런 생활이 지루하다고 말할지도 모릅니다. 실수는 인생에서 가장 아름다운 부분입니다. 허허, 나는 과학 문제만 논의하고,' 낭만주의' 라는 이름으로 결혼을 목적으로 하지 않는 너의 건달형 연애는 무시하겠다. 사실 나도 가끔 불량배를 놀리는 것도 좋다는 것을 마음속으로 인정한다. 허허, 농담을 하다.
빅데이터는 기업의 전통적인 관리 방식을 어느 정도 뒤엎을 것이다. 현대 기업의 관리 모델은 군대의 모방에서 비롯되며, 층층의 조직과 엄격한 프로세스에 의존하며, 층층의 정보 수집 및 수렴에 의존하여 올바른 결정을 내리고, 조직 내 의사 결정의 전달과 분해 및 프로세스의 표준화를 통해 의사 결정의 집행을 보장합니다. 모든 경영 활동에 품질 보증이 있어 어느 정도 위험을 피한다. 이것은 한때 유용하고 서투른 방법이었다. 빅 데이터 시대에 우리는 기업의 관리 모델을 재구성할 수 있다. 대용량 데이터의 분석 및 마이닝을 통해 지속적으로 확장되는 조직 및 복잡한 프로세스에 의존하지 않고도 많은 비즈니스가 자율적으로 의사 결정을 내릴 수 있습니다. 모두들 큰 데이터를 바탕으로 결정을 내리고, 모두 정해진 규칙에 의지하여 결정을 내린다. CEO 결정과 일선 인사 결정에는 큰 차이가 없다. 그렇다면 기업들은 이렇게 많은 수준의 조직과 복잡한 절차가 필요한가?
빅 데이터의 또 다른 중요한 역할은 비즈니스 논리를 변경하여 다른 각도에서 직접 대답할 수 있는 가능성을 제공하는 것입니다. 오늘날 사람들의 사고나 기업의 결정은 사실상 주도적인 역할을 하는 논리적 힘이다. 우리는 조사하고, 데이터를 수집하고, 총결하고, 결국 자신의 추론과 의사결정의견을 형성한다. 이것은 관찰, 사고, 추리, 결정의 상업 논리 과정이다. 사람과 조직의 논리 형성에는 많은 학습, 훈련, 실천이 필요하며 비용은 매우 크다. 그러나 이것이 유일한 방법입니까? 큰 데이터는 우리에게 다른 선택권을 주는데, 바로 데이터의 힘을 이용하여 직접 답을 얻는 것이다. 예를 들어, 우리가 수학을 공부할 때, 젊었을 때 1999 년의 곱셈표를 배웠고, 기하학을 배웠고, 대학에서 미적분을 배웠고, 어려운 문제에 직면했다. 우리는 다년간의 학습 경험을 이용하여 해결하려고 노력하지만, 또 다른 방법은 바로 인터넷에서 이런 문제가 있는지 없는지를 직접 검색하는 것이다. 만약 있다면, 직접 답안을 베끼면 된다. 많은 사람들이 이것이 표절과 부정행위라고 비판할 것이다. 그런데 우리는 왜 공부해야 합니까? 나는 문제를 해결하기 위해서라고 생각했다. 만약 내가 언제든지 답을 찾을 수 있다면, 나는 가장 수월한 방식으로 가장 좋은 답을 찾을 수 있을 것이다. 이런 찾기는 밝은 길이 될 수 없을까? 다른 말로 하자면, 그것이 무엇인지 얻기 위해서, 우리는 왜 그런지 이해할 필요가 없다. 우리는 논리의 힘을 부정하는 것은 아니지만, 적어도 우리에게는 의지할 수 있는 새로운 위대한 힘이 있다. 이것이 바로 미래의 큰 데이터의 힘이다.
큰 데이터를 통해 우리는 새로운 비즈니스 기회를 발견하고 새로운 비즈니스 모델을 재구성하는 새로운 시각을 가질 수 있습니다. 우리는 지금 세계를 보고 있다. 예를 들면 집안의 식품 부패를 분석하는 것은 주로 우리의 눈과 우리의 경험에 달려 있지만, 만약 우리가 현미경을 가지고 있다면, 우리는 단번에 나쁜 세균을 볼 수 있다면, 분석은 완전히 다르다. 빅 데이터는 새로운 관점에서 새로운 비즈니스 기회를 발견하고 비즈니스 모델을 재구성 할 수있는 현미경입니다. Dell 의 제품 설계는 다를 수 있습니다. 고객의 습관과 선호도를 한눈에 알 수 있는 많은 것들이 있습니다. Dell 의 디자인은 고객의 내면에 쉽게 부딪힐 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) 우리의 마케팅도 완전히 다르다. 우리는 고객이 무엇을 좋아하는지, 무엇을 싫어하는지, 더욱 표적이 되는 것을 알고 있다. 특히 현미경과 광각 렌즈는 더 새로운 시야를 갖게 될 것이다. 이 광각 렌즈는 업계를 초월하는 데이터 흐름으로, 과거에 볼 수 없었던 것을 우리에게 보여 준다. 예를 들어, 앞서 언급한 자동차 사건은 운전은 운전이고, 보험은 보험입니다. 이것은 관련이 없습니다. 하지만 우리가 운전한 큰 데이터를 보험회사에 전달하면, 전체 보험회사의 업무 모델은 완전히 바뀌고 완전히 재구성될 것입니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언)
마지막으로, 큰 데이터의 발전이 IT 자체의 기술 아키텍처에 미치는 혁명적인 영향에 대해 이야기하고 싶습니다. 빅 데이터는 IT 시스템을 기반으로 합니다. 우리 현대 기업의 IT 시스템은 기본적으로 IOE(IBM 소형 폼 팩터, Oracle 데이터베이스, EMC 스토리지) +Cisco 모델을 기반으로 합니다. 이 모델은 설정된 모델에서 특정 양의 데이터를 가진 비즈니스 프로세스를 해결하는 데 적합한 세로 확장 아키텍처입니다. 하지만 빅 데이터 시대에는 곧 비용, 기술, 비즈니스 모델의 문제에 직면하게 될 것입니다. 빅 데이터에 대한 IT 수요는 기존 공급업체 아키텍처의 기술 최고치를 빠르게 초과할 것이며, 대량 데이터의 증가는 이로 인해 현재 업계에서 제기된 IOE 화 추세에 따라 수직 확장 아키텍처+독점 소프트웨어 대신 수평 확장 아키텍처+오픈 소스 소프트웨어를 사용하고 있습니다. 본질적으로 빅 데이터 비즈니스 모델이 가져온 것입니다. 즉, 빅 데이터가 IT 업계의 새로운 아키텍처 변화를 주도한다는 뜻입니다. IOE 트렌드에서 이른바 국가 안보 요인이 완전히 부차적이다.
그래서 미국인들은 큰 데이터가 큰 유전, 큰 탄광처럼 끊임없이 큰 부를 발굴할 수 있는 자원이라고 말한다. 그리고 일반 자원과는 달리, 그것은 재생가능하고, 파면할수록 값어치가 있다. 이것은 자연의 법칙에 어긋난다. 기업도 그렇고, 산업도 그렇고, 국가도 그렇고, 사람도 마찬가지다. 누가 이런 것을 좋아하지 않습니까? 따라서 빅 데이터가 이렇게 환영받는 것은 완전히 일리가 있다.
셋째, 새로운 지능형 생물의 탄생
아래의 상상은 더욱 거칠어졌다. 만약 정말로 실현된다면, 적어도 10 대나 100 대 이후가 될 것으로 예상된다. 그때 우리는 이미 선조였다. 공상과학이라고 생각하세요.
마이크로소프트 부사장의 최근 강연부터 시작하겠습니다. 릭 라시드는 마이크로소프트 연구원의 수석 부사장이다. 어느 날 그는 중국 천진의 강단에 올랐는데, 그는 매우 긴장해서 2000 명의 연구원과 학생 앞에서 강연을 해야 했다. 이렇게 긴장한 데는 이유가 있다. 문제는 그가 중국어를 할 줄 모른다는 것이다. 이전에는 번역 수준이 매우 나빠서 이런 난처함을 정해 놓은 것 같다.
Microsoft Institute 의 선임 부사장은 "몇 년 안에 언어 장벽을 깨뜨릴 수 있기를 바랍니다." 라고 말했습니다. 긴장된 2 초 동안 멈춘 후 나팔에서 통역하는 소리가 들려왔다. 라시드는 계속해서 말했다. "개인적으로, 나는 이것이 세상을 더 아름답게 만들 것이라고 생각한다." 잠시 멈추고 중국어로 번역해 주세요.
그는 웃었다. 관중들은 그가 한 모든 말에 박수를 쳤다. 어떤 사람들은 심지어 눈물을 흘렸다. 이런 과격해 보이는 반응은 이해할 수 있다: 라시드의 번역은 쉽지 않다. 모든 말은 천의를 매끄럽게 해석하고, 천의를 매끄럽게 번역한다. 가장 인상 깊었던 것은 이 번역이 사람이 아니라는 것이다.
자연언어의 기계 번역이자 오랜 인공지능 연구의 중요한 표현이다. 인공지능은 과거부터 미래까지 분명하고 거대한 상업 전망을 가지고 있으며 과거 IT 계의 핫스팟으로, 현재의' 인터넷' 과' 빅 데이터' 에 못지않게 뜨겁다. 하지만 과거 인류는 인공지능을 추진하는 연구에 큰 장애를 겪었고, 결국 거의 절망에 빠졌다.
당시 인공지능은 인간의 지적인 사고 방식을 모방하여 기계 지능을 구축하는 것이었다. 기계 번역의 경우, 언어학자와 언어학자들은 대형 사전과 문법, 구문, 의미 관련 규칙을 편찬하기 위해 전력을 다해야 한다. 수십만 개의 단어가 수만 개의 문법 규칙을 가진 어휘를 구성한다. 다양한 상황과 배경을 고려하여 인간 번역을 시뮬레이션한 다음 컴퓨터 전문가가 복잡한 프로그램을 구축합니다. 결국 인간의 언어가 너무 복잡해서 궁법으로는 가장 기본적인 번역의 질에 이르지 못한다는 것을 알게 되었다. 이 길의 최종 결과는 1960 년대 이후 인공지능의 기술 개발이 몇 년 동안 정체되면서 과학자들은' 인간의 두뇌 시뮬레이션' 과' 인간의 두뇌 재구성' 을 통해 인공지능을 정의한 막다른 골목으로 접어들면서 거의 모든 인공지능 프로젝트가 냉궁에 진입했다는 사실을 고통스럽게 발견하였다.
여기에 작은 에피소드가 하나 있다. 내가 대학에 다닐 때, 한 선생님은 국내 인공지능 최고 교수였고, 국내 어느 인공지능 연구회 부회장이었다. 그는 당시의 인공지능이 인공지능이 아니라 인공어리석음이라고 평가했다. 인간의 간단한 행동은 분해되고, 분해되고, 분해되고, 그리고 어설프게 시뮬레이션된다. 이것은 사람들이 어떻게 똑똑해지는 법을 배우는 것이 아니라 가장 어리석은 사람을 흉내내는 가장 간단한 행동이다. (존 F. 케네디, 공부명언) 그는 당시 인공지능의 진보에 대해 달달 계획에서 인간이 달에서 더 멀리 떨어진 것 같다고 우쭐대는 사람들이 있었다고 말했다. 사실 그들은 단지 석두 위에 서서 달에 고백했을 뿐이다. 아, 나는 너에게 더 가깝다. 그가 자신의 사업에 대해 자조하는 것을 나는 지금까지 매우 깊이 기억하고 있다.
나중에 어떤 사람들은 기계가 왜 논리로부터 배워야 하는지 궁금해했습니다. 어렵고 배우기도 어렵다. 기계 자체의 가장 강력한 것은 컴퓨팅 능력과 데이터 처리 능력입니다. 왜 다른 길로 가지 않을까요? 이 길은 IBM 이' 진한 파란색' 을 지나는 길이다. 1997 5 월1/Kloc-0 딥 블루' 는 논리, 인공지능 승리, 혹은 초강력 컴퓨팅 능력으로 이기는 것이 아니다. 사고는 너를 이길 수 없지만 너를 죽일 것이다.
비슷한 논리가 나중에 기계 번역에 적용되었다. 구글, 마이크로소프트, IBM 이 모두 이 길로 들어섰다. 즉, 주로 일치법을 채택하고 기계 학습과 함께 대량의 데이터와 관련 통계에 의존하며, 문법과 규칙을 고려하지 않고 원문과 인터넷의 번역 데이터를 비교하여 가장 가깝고 인용수가 가장 많은 번역 결과를 출력으로 찾아내는 것이다. (윌리엄 셰익스피어, 윈스턴, 기계, 기계, 기계, 기계, 기계, 기계, 기계, 기계, 기계) 큰 데이터와 기계 학습 기술을 이용하여 기계 번역을 실현하는 것이다. 기존 데이터가 클수록 시스템이 더 잘 작동하게 됩니다. 이것이 새로운 기계 번역이 인터넷이 나타난 후에만 돌파할 수 있는 이유입니다.
그래서 현재 이들 회사의 기계 번역팀에는 많은 컴퓨터 과학자들이 있지만, 순수 언어학자도 없다. 그들이 수학과 통계에 능숙하다면, 그들은 프로그래밍할 수 있다.
간단히 말해서, 이 기술을 통해 컴퓨터는 큰 데이터로부터 모델을 구축하는 것을 독학할 수 있다. 많은 정보를 통해 내비게이션, 단어 이해, 언어 번역, 얼굴 인식, 인간 대화 시뮬레이션 등 똑똑해 보이는 일을 할 수 있는 기계를 배울 수 있습니다. 영국 케임브리지 마이크로소프트연구원의 크리스 비샤프는 "벽돌을 충분히 쌓고 몇 걸음 더 물러나면 집을 볼 수 있다" 고 비유했다.
여기서 우리는 이 기술이 계속 개선될 수 있다고 가정한다. 미래에는 큰 데이터와 기계 학습에 기반한 인공지능이 인간의 대화를 더 부드럽게 시뮬레이션할 수 있다. 즉, 인간은 기계와 더 자유롭게 대화할 수 있다. 사실 IBM 의' 왓슨' 프로젝트는 컴퓨터를 의사로 만들려는 시도와 같은 기술 프로젝트다. 대부분의 질병을 진단하고 환자와 교류할 수 있다. 게다가, 새롭게 등장한 웨어러블 컴퓨팅 설비가 이미 큰 발전을 이루었다고 가정한다. 이것은 어느 정도의 진보입니까? 애완견조차도 이미지 수집, 소리 수집, 냄새 수집, 개 건강 상태를 모니터링하는 소형 의료 장비, 강아지 위장의 소화 상태를 모니터링하는 전자 알약과 같은 다양한 센서와 웨어러블 장비를 갖추고 있습니다. 물론 강아지도 인터넷에 연결되어 있고 엄청난 양의 데이터가 생겨났다. 이때 우리는 이러한 큰 데이터 모델링을 기반으로 강아지의 감정을 시뮬레이션한 다음 의인화 처리를 통해 소리를 표현할 수 있다고 가정합니다. 즉, 우리는 강아지가 인간의 말을 흉내낼 수 있다. 예를 들면 주인이 집에 돌아왔을 때 강아지가 꼬리를 흔들며 울면 강아지에 붙어 있는 인공지능 시스템이 이렇게 말할 수 있다. "주인님, 집에 가는 것을 보니 정말 기쁩니다." " 뿐만 아니라 강아지의 인공지능 시스템과도 대화할 수 있다. 이 인공지능 시스템은 기본적으로 너의 뜻을 이해하고 강아지의 의인화된 표정을 대신할 수 있기 때문이다. 가능한 대화를 시뮬레이션합시다.
당신: "강아지, 오늘 어떻게 지냈어요? 클릭합니다
개: "그래, 주인, 네가 오늘 바꾼 새 개밥 맛이 좋다. 늘 배불리 먹지 못한 것 같다. "
당신: "그럼 좋겠네요. 앞으로도 이런 개밥을 계속 살 것이다. 참, 오늘 누가 오나요? "
개: "우체부만 신문을 배달합니다. 또 이웃집 강아지 마리가 우리를 보러 와서 우리는 오후 내내 함께 놀았다. "
당신: "그럼 어떻게 놀았어요? 클릭합니다
개: "매우 행복합니다. 나는 또 첫사랑에 들어간 것 같다. "
......
우리는 위의 모의 대화를 농담으로 삼을 수 있다. 하지만 이 시점에서 우리는 놀라운 사실을 발견할 수 있습니다. 즉, 당신이 직면하고 있는 것은 사실 두 마리의 강아지입니다. 하나는 실제 강아지이고, 하나는 큰 데이터와 기계 학습을 기반으로 한 인공지능 가상 강아지입니다. 그리고 가상 강아지는 실제 강아지보다 더 똑똑하고, 정말 사려 깊습니다. 그럼, 이 가상 강아지는 새로운 지능형 생물인가요?
이 이야기를 계속 확장하여 강아지를 미래인으로 만들어 봅시다. 사람들은 생활에서 대량의 데이터를 생산할 것이다. 이러한 데이터를 바탕으로 우리는 어떤 영화를 좋아하는지, 어떤 음식을 좋아하는지, 어떤 문제가 생기면 어떤 행동을 취할 것인지 등 많은 결론을 직접 도출할 수 있다.
이런 데이터는 이 사람이 사망할 때까지 축적되었다. 우리는이 거대한 데이터가이 사람이 어떤 식 으로든 계속 존재할 수 있다는 대담한 상상력을 가지고 있습니까? 후세 사람들이 어떤 질문에 대한 답을 찾아야 할 때, 예를 들면 인생의 중요한 결정, 예를 들면 대학에서 어떤 전공을 배우는지, 한 여자와 결혼할 것인지, 이 가상인 사람 (조상) 에게 어떤 건의를 할 수 있습니까? 답은 당연히 그렇습니다. 이 경우, 디지털 존재는 생전에도 존재할 뿐만 아니라 사후에도 계속 존재할 수 있다. 사람이 죽으면 가상 공간에서도 계속 존재할 수 있다. 한평생 죽어도 이런 가상 지혜는 계속 존재할 수 있다. 몇 년이 지났다고 가정해 봅시다. 이 가상지혜의 선조들은 너무 많습니다. 살아 있는 후손들은 심지어' 조상 합참모위원회' 를 구성할 수도 있습니다. 시험을 잘 받은 사람들 (예: 1 등 당첨), 고위 공무원 (예: 현), 기업 임원 (예: CEO), 교수, 작가 등의 조상입니다. 이 선조들이 죽은 후에 겨루게 해도 죽지 않아도 별일 없다. 이 장면은 매우 익숙합니까? 디즈니 애니메이션' 화목란' 에 나오는 장면입니다. 아버지를 대신해 군에 입대할지 여부에 대한 중대한 인생 순간에 화목란' 조상의 참모장 연석회의위원회' 에 자신의 곤혹을 토로하고 충고를 받았다.
더 과감한 상상력, 재료과학도 큰 발전을 이루었다고 가정하면, 우리가 이 가상생명을 모의 인류의 생태계에 다시 이식할 수 있을까? 물론 할 수 있습니다. 이 새로운 지능은 실물과 매우 비슷하다. 이것은 죽은 후에 부활하는 것입니까? 그래서이 새로운 지식인은 이전 신분증을 계속 가질 수 없습니까? 이전 부동산을 계속 소유할 수 있습니까? 연금을 계속 받을 수 있을까요? 강제 수명 제한이 있습니까? 이런 지혜는 스스로 진화를 배울 수 있을까? 그들은 인류와 전쟁을 벌일 것인가? 깊이 생각하고, 완전히 혼란스러웠고, 지금은 윤리와 법률이 모두 큰 도전에 직면해 있다.
이 모든 것은 무엇을 의미합니까? 빅데이터와 기계 학습이 더욱 발전함에 따라 이 세상에 새로운 지혜의 생물이 생겨났다! 빅데이터와 기계가 많은 기업, 산업, 국가를 변경, 재구성, 전복시킨 후, 마침내 인류를 바꿀 때가 되었습니다! 인류의 진화에는 새로운 가지가 나타났다!
일부 과학자들은 이 두 가지 지능 생물을 묘사하기 위해 다음 그림을 그렸다. 하나는 생물학을 바탕으로 수백만 년의 진화를 거칩니다. 하나는 IT 기술을 기반으로, 큰 데이터와 기계 학습을 기반으로 하며, 자기 시뮬레이션과 자기 학습을 통해 배운다. 전자는 더 논리적이고, 더 감정적이고 창조적이지만, 생명은 제한되어 있다. 후자는 논리와 생물학적 감정이 강하지 않지만 계산, 모델링, 검색 능력이 뛰어나 이론적으로 생명은 무한하다.
물론, 이런 일들은 아주 먼 곳에서 일어날 것이다. 어차피 우리는 살아서 볼 수 없고, 죽어도 볼 수 없다. 우리가 죽으면, 나는 이런 큰 데이터와 기계 학습을 기반으로 한 가상 생명이 아직 존재하지 않을 것이라고 믿는다.
넷. 끝말
마지막으로, 미래에 대한 우리의 인식은 주로 상식과 미래에 대한 상상력에 기반을 두고 있다는 것이다. 뉴욕타임즈의 일주일 정보량은 18 세기 한 사람이 평생 받는 정보량보다 더 큰 것으로 집계됐다. 현재 18 개월은 지난 5,000 년의 합계보다 더 많은 정보를 생성합니다. 지금 우리 집에 5000 원짜리 컴퓨터 한 대의 컴퓨팅 능력은 내가 처음 대학에 들어갔을 때보다 전교가 강했다. 기술의 진보는 영원히 우리의 상상을 초월할 것이다. 만약 미래에는 한 사람이 가지고 있는 컴퓨터 장비가 현재 글로벌 컴퓨팅 능력의 합계를 초과한다면, 한 사람이 생산하는 데이터의 양은 현재 글로벌 데이터의 합계를 초과하고, 심지어 당신의 애완견이 생산하는 정보의 양이 현재 글로벌 데이터의 합계를 초과한다면, 세계는 어떤 일이 일어날까요? (윌리엄 셰익스피어, 햄릿, 컴퓨터명언) (윌리엄 셰익스피어, 윈스턴, 컴퓨터명언) 그것은 당신의 상상력에 달려 있습니다.