- 인공지능은 데이터를 기반으로 작동한다. 인공지능 기술을 사용하기 앞서 데이터와 관련된 기반이 선행해야만 한다.
- 인공지능의 역사:
- ML/AI 관련 학계 논문들은 1970년대까지 올라간다, 나아가 1950년대가 그 태동기로 언급된다.
- 1970~1990 제 1차 AI 산업화
- 1990~2010 과학적 방법론의 도입 시대로 신경망연구, 베이지안 추론, 로봇 대회 등이 등장
- 2010~현재 제 2차 AI 산업화 -> 자율주행, 머신러닝 산업화, 딥러닝 산업화
- 이 변화의 기저에는 Computing 기술의 발달 때문
- 방법론의 변화
- 1세대 기호주의 인공지능은 합리론 기반. 규칙을 프로그래밍. 소위 우리가 알고 있는 Rule Base Logic
- 2세대 연결주의 인공지능은 경험론에 기반하는 방법으로, 데이터를 통해 학습하는 신경망 시스템. 데이터를 기반으로 로직을 적용
- 미래 3세대 인공지능은 실세계 환경에서 지각행동 및 경험을 스스로 체화 지식을 만드는 구성주의적 인지 방법으로 발전할 것. 즉, 데이터를 받아들이는 동시에 처리 이해 학습 모든게 바로바로 즉각적으로 발생하는.
- 인공지능이 답변해야 하는 문제들로:
- 인공물이 스스로를 어떻게 제어
- 효용을 최대화/극대화하는 의사결정 방법
- 불확실한 정보하에서의 추리
- 언어와 사고의 연결관계
- 효율적인 컴퓨터
- 인공지능 산업 사용 예시
- 텍스트 기반 해석, 자연어처리, 음성인식
- 챗봇, 대화시스템
- RPA(Robotic Process Automation), 물체인식/추적
- 추천시스템, 진단시스템(이미지 처리)
- 중국의 경우 2017년 인공지능을 국가전략산업으로 채택하였고 3단계 목표를 제시
- 2020년까지 기술응용 선진국 육성 (연관산업 매출액 1500억 위안)
- 2025년 인공지능 기초이론 및 기술 선도국가 진입 (연관산업 매출액 4000억 위안)
- 2030년 글로벌 인공지능 혁신 강국 진입 (연관산업 매출액 1조 위안, 생산유발 효과 10조 위안)
허황된 이야기 처럼 들릴 수 있으나, 중국 테크 기업들 (알리바바, 바이두, 텐셐트 등)의 AI 투자 금액은 상상초월. 2018년 기준 투자액이 128억달러로 집계되는데 미국의 7배였던 상황.
- 한국의 경우 2018년부터 5년간 2.2조원 투자. 2022년까지 6개의 대학원을 설립하며 5000명의 인공지능 전문가 육성.
- (카이스트 인공지능 대학원이 그 중 하나인것같다..)
- 한국의 경우 다른 주요국 대비 매우 뒤쳐져 있는 상황이다. 투자 금액도 매우 적고..
인공지능 그 자체가 대단한 변화와 힘을 낸다고 생각하기보다는, 합리적인 행동방식이나 규칙이 쉽게 발견되는, 여러가지 사항들을 동시에 묶어서 처리될 수 있는 힘은 특정 산업과 결부되는 경우 어마어마한 변화를 발생시키는 힘이 된다.
예를 들면) 국방, 헬스케어, 보안 등 사회의 초석이 되는 여러 산업에 적용되는 것..
세계 AI 시장은 엄청나게 빠른 속도로 커지고 있다. 2014~2019년 5년간 연 38%의 성장이라고 하니..
국내 시장의 규모는 '20년 예측치가 11조원.. 터무니 없이 작다. 아마 제대로 된 시장 측정도 안되고 있는 상황으로 보는게 맞지 않나 싶다. 그래도 제일 큰 성장이 예상되는 분야는 전문시스템, 지능형 개인비서, 자율롯 분야이다.
인공지능의 상용화와 실제로 힘을 발휘하는 시점은 2030년대를 잡고 있는 모양세이다.
-> 지금은 OpenAI 등과 괕은 오픈소스 활성화로 상당히 많은 시장 참여자가 발생, 전체 AI/ML 시장 자체가 성장하고 커지고 있는 상황
아직까지는 두루뭉실하다. AI/ML Concept들에 대해서 디테일한 부분들까지 들어가기는 어렵다. 무수히 많은 알고리즘과 접근법들이 있고 각각의 알고리즘 더 밑으로 들어가게 되면 극도로 수학적인 영역이 펼쳐진다.
중소기업 전략기술 로드맵 2019-2021 인공지능 편은 일반인이 이해하기 쉬운 적용 분야를 소개해 준다.
- ML/AI 를 고도로 사용하는 사회로의 진입을 위해서는 다시한번 데이터 그리고 통신이 강조 된다.
- IoT 센서를 통해 데이터를 수집 -> 통신
- 실시간 데이터의 처리/연산 (computing power)
AI의 분류는 아래와 같다.
기술이 복잡해 보이나, 결국에 큰 틀에서 바라보면
(1) 후방 산업 : 데이터 취합/인지 장치, 처리 장치
(2) 인공지능/SW 분야 : 알고리즘 , 서비스 핵심 기술들
(3) 전방 산업 : 어떤 산업과의 접합 (상품화)
- 국내 기술 동향
- 빅스비와 같은 지능형 비서, 인공지능 로봇
- 들어가는 기술에 음성인식, 안면인식도 존재
- 대형화 엔진을 통해 정보 수집, 분석 능력 확립 (지능 개발)
- 챗봇
- GPU 기반 딥러닝 기술, 패턴 인식, 빅데이터 병렬처리
- XRay에 접목하여 자동판독 등
- 빅스비와 같은 지능형 비서, 인공지능 로봇
이외에도 추가적으로 개발은 진행중인 상황
2018년 부터 분야를 선정하여 개발되고 있는 분야로는 아래와 같다.
위 기술 중 기존에 우리가 선두하고 있는 기술들과 시너지가 생길 수 있는 분야가 어디인지 파악하는게 핵심적으로 보인다.
이미 뒤쳐져 있는 국내 개발 현황을 고려하면, 우리가 선점하고 영역과 더불어 적용되는 것이 무엇인지, 삼성전자, 네이버, 카카오 등의 ICT 기업들의 우위성을 이용할 수 있는 분야가 어디인지, 그리고 그 안에서 개발이 빠르고 기술력을 갖춘 회사가 어디인지 추려내는 작업을 진행하여 투자 회사를 찾아내는게 중요해 보인다.
ML Ops란 무엇인가?
마소에 따르면, ML/AI 모델로 비즈니스를 영위하는 경우, 기존의 모델에 대해서 변화가 요구될때 매우 번거로운 상황을 언급한다. 모델의 파라미터 업데이트, 데이터 업데이트, 새로운 training 등 이러한 변화를 영위 중인 비즈니스에 interupt 없이 진행할 수 있느냐?
결국 ML Ops 는 개발과 운영의 갭을 매워주는 기존 DevOps와 그 결이 비슷한 것이다.
DevOps는 기존의 개발 방식에 있어 불편들이 해소되는 업무 프로세스이다.
전통적으로 (1) 코드 개발 -> (2) 코드 저장 -> (3) 코드 배포 프로세스로 업무가 진행되었고, 추가 개발.수정이 필요한것은 사람들이 붙어서 작업을 했고 여기서 human error도 많이 발생하고 그랬다. 이 보수 및 유지 작업을 반복적으로 수행하고 코드들을 통합하는, Coninuous Integration & Continuous Delivery, 업무의 문화를 아우르고 인프라를 개발/관리 하는 역할 이것을 DevOps라 부른다.
결은 비슷하나, ML의 특성으로 인해 상이한 점들이 존재하는데, 선행되는 데이터 분석 작업이다.
머신러닝/딥러닝의 경우 DevOps 에서의 (1),(2),(3)에 앞서 (0)단계가 존재한다.
- (0) 문제 인식, 데이터 취득 이해, 분석 -> 모델 채택, feature 엔지니어링, 검증, 테스트 , 자동 -> 운영/모델서비스화, 재학습 모디터링
위와 같은 루틴의 작업이 결론이 나야 구체적인 개발 Dev 단계로 들어간다.
위의 ML 검증 작업에 편리성을 제공하는 플랫폼이 Azure ML workspace인 것. 기업에서 하는 프로젝트 단위의 scale에 맞는 디테일한 파이프라인 관리, 통합 서비스가 제공되는 형태.
위와 같은 서비스가 왜 필요한지는 DL 프로젝트를 경험해본 사람이라면 알 것이다. 데이터가 커지는 경우 정말 학습 시간이 오래걸리기 시작한다. 길게는 몇 주 달단위 까지 요구된다. 여기에 새롭게 등장한 단어가 있다, CI, CD에 이어 CT (Continuous Training).
- 더 자세한 설명은 아래 링크를 통해 확인해볼수 있다.
대기업 계열사들의 ML/AI 개발과 프로젝트는 사내에서 모두 진행되고 있다.
- 위 채용공고만 보더라도, 정확히 위에 언급된 ML 선행 작업이다.
- Proof of Concept 업무를 진행, 개발자들과 검증, 예측 모델 학습과 운영, 기술검토, ML/DL 학습 지원 운영
문득 드는 생각은, 과연 기업들이 이 업무를 외주 주고 싶어할까? 아니라고 생각한다. 너무 핵심적이고 중요한 기술이다. 다만 마소가 제공하는 플랫폼은 편리성을 위해 이용하지 않을까 싶다.
-> ML Ops는 위의 3박자(데이터 사이언티스트 업무, 개발업무, 운용/보수/배급 업무)를 통합시켜서 작업을 가능하게 하는 업무 프로세스 형태인 것이다. 여러가지 장단점이 존재하는 업무 프로세스 형태이다.
그리고 이 모든 작업에 선행되는 것은 손 쉬운 데이터로의 접근이다. Cloud 가 커질수밖에 없는 이유라고 생각한다.
보안도 그렇고.
모든게 다 이어진다. SD-WAN은 인터넷 망을 통해 모든것을 접속할 수 있게 해주는 통신망이다.
라우팅 효율 증대(orchestration) 역할에 있어서 또 ML이 들어간다...
인터넷망을 통하는 가장 큰 위협이 보안문제이다.
편리성에 대가로 지불하는 망분리의 포기...
차세대 SD-WAN은 보안 측면에서의 단점을 업데이트한 것들이 업급되고 있다.
'주식과 산업 이야기' 카테고리의 다른 글
대한전선 종목 분석 feat. 호반산업 (2편) (2) | 2022.07.18 |
---|---|
대한전선 종목 분석 feat. 호반산업 (1편) (0) | 2022.07.18 |
핀테크 시장 (0) | 2022.07.15 |
엔켐 / 2차전지 (0) | 2022.07.15 |
헥토파이낸셜(세틀뱅크)/ 결제 관련주/ 핀테크 분석 (1) | 2022.07.14 |
댓글