본문 바로가기

개념 이론 수학

머신러닝에서의 컴퓨터 공학

키워드: Math, Algorithm, Hardware/Software, Computer Engineering, Computer Science, Pattern Recognition, (Big) Data, Machine Learning

머신러닝과 분야별 조합

머신러닝은 실생활의 문제를 해결하기위해 발전되고 있는 compound 개념

  1. 컴퓨터 공학적인 머신러닝 전문가
    • 만들어진 소스코드를 통해 데이터를 바라본다
  2. 통계학적인 머신러닝 전문가
    • 수학을 통해 데이터를 바라본다

데이터 마이닝?

  • '사람에게 인사이트를 제공'하는것

머신러닝은?

  • 개발자가 만든 프로그램을 활용하여 '데이터부터 시작하여 패턴(또는 모델)을 학습하고 알고리즘을 활용하여 데이터에 대해 특정 작업을 수행하는 과정'
    • 머신러닝에서 데이터는 어떻게 처리하여 새롭게 만들 것인가에 초점. (사람->데이터)
    • 컴퓨터 공학 개념에서 복합적인 개념을 이해해야 하는 이유

데이터?

  • 한사람이 만들어낸 것이 아닌 다양한 사람의 특정 의도에 의해서 혹은 어떤 의도도 없이 만들어진것
    • 머신 러닝에서 데이터는 지도학습, 비지도학습, 강화학습 다양한 방법이 존재하고 결과를 판단하기에 있어 단순 숫자 해석이 아닌 복잡한 수학개념을 활용한다.

빅데이터?

  • 데이터의 양이 많거나, 분류해야 될 종류가 다양한 데이터
  • 하드웨어와 소프트웨어에 의해 빅데이터의 범위는 달라지고 있다는것을 인지 해야한다. 
  • 빅데이터에서는 데이터만이 주체가 아니라 상관관계인 요소들이 많다는것을 인지해야한다.

분석하기 좋은 빅데이터는?

  1. 메타데이터끼리의 연관성
  2. 데이터의 7v 특성

머신러닝에서 머신러닝 모델을 바라볼때?

기능적으로만 바라보지 말고 아래의 요소를 다각적으로 분석해 보아야 한다.

  1. 언제 써야 할지
  2. 결과 값이 어떤 파라미터에 의해 나왔는지
  3. 모델의 계산 방식
  4. 데이터셋에 영향을 주는 모델 및 파라미터 등