키워드: Math, Algorithm, Hardware/Software, Computer Engineering, Computer Science, Pattern Recognition, (Big) Data, Machine Learning
머신러닝은 실생활의 문제를 해결하기위해 발전되고 있는 compound 개념
- 컴퓨터 공학적인 머신러닝 전문가
- 만들어진 소스코드를 통해 데이터를 바라본다
- 통계학적인 머신러닝 전문가
- 수학을 통해 데이터를 바라본다
데이터 마이닝?
- '사람에게 인사이트를 제공'하는것
머신러닝은?
- 개발자가 만든 프로그램을 활용하여 '데이터부터 시작하여 패턴(또는 모델)을 학습하고 알고리즘을 활용하여 데이터에 대해 특정 작업을 수행하는 과정'
- 머신러닝에서 데이터는 어떻게 처리하여 새롭게 만들 것인가에 초점. (사람->데이터)
- 컴퓨터 공학 개념에서 복합적인 개념을 이해해야 하는 이유
데이터?
- 한사람이 만들어낸 것이 아닌 다양한 사람의 특정 의도에 의해서 혹은 어떤 의도도 없이 만들어진것
- 머신 러닝에서 데이터는 지도학습, 비지도학습, 강화학습 다양한 방법이 존재하고 결과를 판단하기에 있어 단순 숫자 해석이 아닌 복잡한 수학개념을 활용한다.
빅데이터?
- 데이터의 양이 많거나, 분류해야 될 종류가 다양한 데이터
- 하드웨어와 소프트웨어에 의해 빅데이터의 범위는 달라지고 있다는것을 인지 해야한다.
- 빅데이터에서는 데이터만이 주체가 아니라 상관관계인 요소들이 많다는것을 인지해야한다.
분석하기 좋은 빅데이터는?
- 메타데이터끼리의 연관성
- 데이터의 7v 특성
머신러닝에서 머신러닝 모델을 바라볼때?
기능적으로만 바라보지 말고 아래의 요소를 다각적으로 분석해 보아야 한다.
- 언제 써야 할지
- 결과 값이 어떤 파라미터에 의해 나왔는지
- 모델의 계산 방식
- 데이터셋에 영향을 주는 모델 및 파라미터 등
'개념 이론 수학' 카테고리의 다른 글
[인공 지능] 머신 러닝과 딥러닝의 차이 (0) | 2021.08.20 |
---|---|
[통계] 가설 검정 - 독립 변수 (Independent variable) / 종속변수 (Dependent variable) / 통제변수(control variable) (0) | 2021.06.20 |
[통계] 가설검정2 - Type of Error (0) | 2021.06.20 |
[통계] 가설검정1 - Student T-test (ft. z-test) (0) | 2021.06.20 |
[통계] 가설검정 (0) | 2021.06.20 |