1. 책 DB를 넣어주세요.
2. 나의 스터디 흔적을 사진으로 보여주세요.
3. 이번 스터디에서 특별히 좋았던 점이나 어려웠던 점이 있었나요? 새로 알게된 부분이 있다면 알려주세요.
데이터 마이닝
: 무수한 데이터 안에서 가치 있는 정보를 추출하는 과정
빅데이터
- 다양한 형태를 갖고 있고, 생성 속도가 빠르며, 가치를 창출할 수 있는 대량의 데이터
- 빅데이터의 5가지 속성 : volume(규모), variety(다양성), velocity(속도), veracity(진실성), value(가치)
좋은 데이터의 4가지 조건
1) 대표성
2) 충분한 양
3) 품질
4) 학습에 최적화된 특성
※ 전처리(preprocessing)
- 데이터 품질을 높이기 위한 방법의 일종
- 인공지능 학습에 나쁜 영향을 줄 수 있는 데이터를 미리 골라내거나 좋은 형태로 바꾸는 것
※ 특성(feature)
- 인공지능이 학습할 데이터는 데이터 자체가 아닌 데이터에서 추출한 특성
- 유용한 특성을 찾아내는 것을 특성 공학(feature engineering)이라고 한다.
데이터 수집에 도움을 주는 사이트들
- AI 허브 aihub.or.kr
- 공공 데이터 포털 data.go.kr
- 서울 열린 데이터 광장 data.seoul.go.kr
- 데이콘 & 캐글 dacon.io
4. 열심히 실습한 코드를 저장해 첨부해 주시거나 자랑할만한 스크린샷이 있다면 올려주세요.
이론 위주의 챕터로, 작성한 코드가 없습니다.
728x90
반응형
'etc. > Do it! 공부단' 카테고리의 다른 글
Do it! 첫 인공지능 / 04단원 티처블 머신으로 인공지능 만들기 (0) | 2022.06.04 |
---|---|
Do it! 첫 인공지능 / 03단원 알고리즘이 궁금해 (0) | 2022.05.12 |
Do it! 첫 인공지능 / 01단원 인공지능, 너의 정체는 뭐니? (0) | 2022.05.10 |
Do it! 점프 투 파이썬 / 07단원 정규 표현식 (0) | 2022.04.20 |
Do it! 점프 투 파이썬 / 06단원 파이썬 프로그래밍 어떻게 시작해야 할까? (0) | 2022.04.20 |