etc./Do it! 공부단

Do it! 첫 인공지능 / 02단원 인공지능을 만드는 데이터

innit 2022. 5. 11. 12:59

1. 책 DB를 넣어주세요.

2. 나의 스터디 흔적을 사진으로 보여주세요.

3. 이번 스터디에서 특별히 좋았던 점이나 어려웠던 점이 있었나요? 새로 알게된 부분이 있다면 알려주세요.

데이터 마이닝

: 무수한 데이터 안에서 가치 있는 정보를 추출하는 과정

빅데이터

- 다양한 형태를 갖고 있고, 생성 속도가 빠르며, 가치를 창출할 수 있는 대량의 데이터

- 빅데이터의 5가지 속성 : volume(규모), variety(다양성), velocity(속도), veracity(진실성), value(가치)

좋은 데이터의 4가지 조건

1) 대표성

2) 충분한 양

3) 품질

4) 학습에 최적화된 특성

※ 전처리(preprocessing)

- 데이터 품질을 높이기 위한 방법의 일종

- 인공지능 학습에 나쁜 영향을 줄 수 있는 데이터를 미리 골라내거나 좋은 형태로 바꾸는 것

※ 특성(feature)

- 인공지능이 학습할 데이터는 데이터 자체가 아닌 데이터에서 추출한 특성

- 유용한 특성을 찾아내는 것을 특성 공학(feature engineering)이라고 한다.

데이터 수집에 도움을 주는 사이트들

- AI 허브 aihub.or.kr

- 공공 데이터 포털 data.go.kr

- 서울 열린 데이터 광장 data.seoul.go.kr

- 데이콘 & 캐글 dacon.io

4. 열심히 실습한 코드를 저장해 첨부해 주시거나 자랑할만한 스크린샷이 있다면 올려주세요.

이론 위주의 챕터로, 작성한 코드가 없습니다.

728x90
반응형