2021(39)
-
6주차: 데이터사이언스의 미래
데이터 사이언스의 악용 가능성 - 데이터가 수집된 방법 & 수집된 이유 & 데이터의 한계 & 방법의 한계를 신경쓰지 않으면, 악용 될 수 있다. - 데이터의 이해가 제대로 되지 않으면 잘못된 가정 또는 무의미한 진술을 할 수 있다. - 프라이버시가 보호되고, 투명성을 보장해야한다. 10년 후 데이터 사이언스의 전개 - 대기업들이 쇼핑 거래 분석을 수행하고 공급망과 공급방식을 합리화하는 방법을 찾을 것이다. - 미래에는 우리의 생활 방식, 건강, 우리의 가정환경, 소비하는 에너지, 우리가 하는 요리, 식료품이나 연료의 관점에서 우리가 주문하는 자원과 얻어내는 방법들이 변화할 것이다. - 우리의 삶과 삶의 방식, 문화, 사회에 걸친 컴퓨터와 스마트폰 뿐만 아니라 모든 종류의 센서 및 데이터 제작자와 데이터에..
2021.05.18 -
5주차 강의: 데이터 시각화
데이터 시각화의 목적과 데이터 사이언스 내의 역할에 대해 설명한다. 탐색 및 설명 시각화의 차이점을 설명한다. 여러 데이터 유형과 사용할 수 있는 시각화 유형을 비교한다. 시각적으로 데이터를 인코딩하는 과정과 사용할 수 있는 다양한 인코딩을 설명한다. 특정 데이터 인코딩의 효율성을 평가한다. Python(Bokeh)을 사용해 시각화를 제작한다. 데이터 시각화의 정의 통계 그래프, 플롯(plot) 및 정보 그래픽을 사용해 명확하고 효율적으로 정보를 전달하는 것 By Tufte. 데이터가 보여주는 것을 취하는 방법, 최선의 방법으로 전달하는 도구 -> 즉 데이터의 주요 특징들을 매우 빠르게 파악할 수 있게 한다. 따라서 보는 사람들이 데이터를 통해 전달되는 흥미로운 통찰력을 찾도록한다. 데이터 시각화의 역할..
2021.05.13 -
3주차 강의: 통계 및 머신러닝
데이터 사이언스 응용 프로그램에서 사용하기 위한 다양한 데이터 소스 설명이 가능하다. 데이터에 대한 다양한 라이선스 옵션 비교가 가능하다. 데이터 수집을 위한 API의 역할 설명이 가능하다. 데이터 정리의 역할을 설명할 수 있다. 데이터 수집 기술을 적용해 MongoDB에 데이터 저장 및 관리가 가능하다. 여러 출처에서 데이터를 수집하는데 따른 이점 및 문제점을 평가 할 수 있다. MongoDB에서 데이터를 추출하기 위한 쿼리 작성이 가능하다. 데이터 사이언스 파이프라인 데이터 수집 -> 데이터 처리 -> 데이터 클리닝 및 통합 데이터 및 데이터 수집 소스 데이터 전처리와 통합 데이터 저장 및 관리(물리적 로컬 시스템 사용에 대한 클라우드 기반 저장 및 처리) 데이터 수집 및 데이터 소스 웹상의 데이터 ..
2021.04.28 -
2주차 강의: 데이터 사이언스의 핵심 개념과 기술
데이터 사이언스가 무엇인지 설명할 수 있다. 데이터 사이언스가 통계 및 컴퓨터 과학을 비록한 다른 분야와 다른 이유를 설명할 수있다. 관련된 데이터 사이언스 프로세스 및 단계를 요약할 수 있다. 데이터 사이언스로 간주되는 것을 받영할 수 있다. 다양한 소스에서 유래된 데이터 유형을 분류 가능하다. 데이터 사이언스를 수행하는데 필요한 광범위한 기술 역량을 요약할 수 있다. 데이터 사이언스 개요 빅데이터와 데이터사이언스의 차이 빅데이터는 IT와 매우 큰 관련이 있거나 컴퓨터 과학 및 엔지니어링에 중점을 둔다. 또한 특허를 식별하고, 조직에 새로운 유용한 것을 발견하기 위해 다양한 출처의 많은 데이터를 수집하고 사용한다. 즉, 빅데이터에 의해 생기는 기회에 중점을 둔다. Volume(양) Variety(다양성..
2021.04.26 -
스택/큐_기능개발
문제 설명 프로그래머스 팀에서는 기능 개선 작업을 수행 중입니다. 각 기능은 진도가 100%일 때 서비스에 반영할 수 있습니다. 또, 각 기능의 개발속도는 모두 다르기 때문에 뒤에 있는 기능이 앞에 있는 기능보다 먼저 개발될 수 있고, 이때 뒤에 있는 기능은 앞에 있는 기능이 배포될 때 함께 배포됩니다. progresses: 먼저 배포되어야 하는 순서대로 작업의 진도가 적힌 정수 배열 speeds: 각 작업의 개발 속도가 적힌 배열 각 배포마다 몇 개의 기능이 배포는지 return 제한 사항 작업의 개수(progresses, speeds배열의 길이)는 100개 이하입니다. 작업 진도는 100 미만의 자연수입니다. 작업 속도는 100 이하의 자연수입니다. 배포는 하루에 한 번만 할 수 있으며, 하루의 끝에..
2021.03.18 -
스택/큐_주식가격
문제 설명 초 단위로 기록된 주식가격이 담긴 배열 prices가 매개변수로 주어질 때, 가격이 떨어지지 않은 기간은 몇 초인지를 return 하도록 solution 함수를 완성하세요. 제한사항 prices의 각 가격은 1 이상 10,000 이하인 자연수입니다. prices의 길이는 2 이상 100,000 이하입니다. 입출력 예 price return [1, 2, 3, 2, 3] [4, 3, 1, 1, 0] 입출력 예 설명 1초 시점의 ₩1은 끝까지 가격이 떨어지지 않았습니다. 2초 시점의 ₩2은 끝까지 가격이 떨어지지 않았습니다. 3초 시점의 ₩3은 1초뒤에 가격이 떨어집니다. 따라서 1초간 가격이 떨어지지 않은 것으로 봅니다. -> 이부분 주의 4초 시점의 ₩2은 1초간 가격이 떨어지지 않았습니다. 5..
2021.03.18