etc./Do it! 공부단
Do it! 첫 인공지능 / 02단원 인공지능을 만드는 데이터
innit
2022. 5. 11. 12:59
1. 책 DB를 넣어주세요.
2. 나의 스터디 흔적을 사진으로 보여주세요.

3. 이번 스터디에서 특별히 좋았던 점이나 어려웠던 점이 있었나요? 새로 알게된 부분이 있다면 알려주세요.
데이터 마이닝
: 무수한 데이터 안에서 가치 있는 정보를 추출하는 과정
빅데이터
- 다양한 형태를 갖고 있고, 생성 속도가 빠르며, 가치를 창출할 수 있는 대량의 데이터
- 빅데이터의 5가지 속성 : volume(규모), variety(다양성), velocity(속도), veracity(진실성), value(가치)
좋은 데이터의 4가지 조건
1) 대표성
2) 충분한 양
3) 품질
4) 학습에 최적화된 특성
※ 전처리(preprocessing)
- 데이터 품질을 높이기 위한 방법의 일종
- 인공지능 학습에 나쁜 영향을 줄 수 있는 데이터를 미리 골라내거나 좋은 형태로 바꾸는 것
※ 특성(feature)
- 인공지능이 학습할 데이터는 데이터 자체가 아닌 데이터에서 추출한 특성
- 유용한 특성을 찾아내는 것을 특성 공학(feature engineering)이라고 한다.
데이터 수집에 도움을 주는 사이트들
- AI 허브 aihub.or.kr
- 공공 데이터 포털 data.go.kr
- 서울 열린 데이터 광장 data.seoul.go.kr
- 데이콘 & 캐글 dacon.io
4. 열심히 실습한 코드를 저장해 첨부해 주시거나 자랑할만한 스크린샷이 있다면 올려주세요.
이론 위주의 챕터로, 작성한 코드가 없습니다.
728x90
반응형