본문 바로가기
kipfa 필기

0821_빅데이터수업_성희필기

by 헤옹스 2017. 8. 21.


It, 인공지능은 기초산업이라고 볼 수 없다. 


기반기술 - 번역기술(파파고) 등을 통해 전세계에서 필요한 기능들을 수집하고 분류할 수 있다.


이제는 "클라우드" 하나로 통합할 수 있는, 네트워크를 무한정 사용하게 해주어야 한다.


즉, 클라우드를 만들어주면 알아서 발전할 것이다.


정부는 it기술을 지원하는게 아니라 클라우드, 인프라를 만들어주어야 한다. 




텐서플로우등 무료로 쓸 수 있는 것들이 많다. 그런데 왜 못할까. 물리적인 서버가 필요하다.


인공지능이 가장 일반적으로 쓰이는 곳은 "증권사"

어느 인공지능이 더 뛰어날까?

각자 차이는 별로 없다.

그러면 수익률을 높이는 방법은 무엇일까?


파괴적인 방법?



우리나라에서 빅데이터/인공지능이 발전하지 못한 가장 큰이유는 데이터량에 대한 집착/데이터 네트워크에 대한 이해도가 떨어짐 (한글만, 지능이 떨어짐)/빅데이터와 클라우드는 인프라이다. 기술이 아니다. 인프라사업이지 주요사업이 아니다. 



빅데이터가 아닌 스마트 데이터

나에게 필요하지 않은 데이터는 쓰레기 데이터다. 



소셜데이터 를


빅데이터기술은 텍스트뿐만 아니라. 안면인식,음성인식까지 포함한다. 



Case1 ) 강남역의 어느 상권이 좋을까.

*지나가는 사람이 아니라 머무르는 사람

->센서로 받아서 측정

기기원가는 100 /분석비는 1900만원


Case2 ) 신한은행 카드나인

500억 데이터센터 구축

온라인 사용량 70%  무엇을 샀는지 안나온다.

오프라인은 30%



#

핵심이 빠져있다.


뭐샀는지는 모른다. 장소만 알 뿐

그럼 무엇을 추천해줄 수 있겠는가. 


삼성이나, 현대는 데이터센터를 구축했지만 

대부업체일뿐 팔려고 한다. 

모바일에서 존재감이 없다. 




#서브파티

서브파티?를 쓸 줄은 모른다. 


신용카드회사에서 사람들이 어디를 가는지 알고 싶으면

비행기 사에서 마일리지에 대한 데이터를 가져오면 된다. 


오퍼를 미리 던지면 된다

카드사에서 먼저가격을 제시하면

그 가격이 찍히면 그 물건을 산거다. 



#크롤링 엔진, 로봇을 100 믿을 수 있는가.

오류가 아직 높다. 완전무결체가 아니다.

사람이 30이면 로봇은 40이다. 


빅데이터는 할 수 있는 것은 많지만, 많기 때문에 못한다. 


***수많은 오류가 나올 수 있다는 것을 알아야 한다.

100이라고 이야기한다면, 무당이나 사기꾼이다.


데이터를 분석하기 위해선 기준이 있어야한다.

기준을 만들고 다른 것을 비교할 수 있는게 사람이다 .


이런 것을 보완하기 위한게 "인공지능"이다. 

인공지능에 알고리즘을 부여하는 것은 결국 사람.


파파고의 정확도를 1%올릴 때 1년걸림.


음성인식은 10년동안 10퍼센트올라갔다


내가 필요한 데이터가 무엇인지 정의하고 정확하게 찾는 능력이 중요하다 

반 이상이고 나머진 툴(TOOL)일 뿐이다. 


정량적인 데이터는 미래를 만들지 못한다.

정성적인 데이터만이 미래를 만들어 낸다. 



**가장 많이 하는 실수

1)너무 크게 시작한다. 작은 것에서 부터 시작하여라.

2)작은 것에도 실수가 일어날 수 있다. 언제든 시행착오가 일어난다는 것을 알아야 한다.  


데이터는 크고 거대한 무엇인가가 아니다. 




'kipfa 필기' 카테고리의 다른 글

0825  (0) 2017.08.25
0821_빅데이터 첫번째 수업  (0) 2017.08.21
0821_빅데이터 2번째 수업  (0) 2017.08.21
0811_수업  (0) 2017.08.11
0811 UI/UX수업_과제발표_서비스 디자인  (0) 2017.08.11