우리는 구글 지오코딩 API를 활용해서 장소(ex_'강남', '해운대해수욕장', 황상동)를 보내면 위도와 경도를 받는 코드를 만들어 보자. 기본적으로 구글 클라우드를 가입한다. 그리고 프로젝트를 생성 후에 인증키를 받아둔다. 이 부분은 여기를 보고 오자. 여러 구글링을 통해 위의 단계를 마쳤다면 이제 아래의 방법을 따라오자. 우리는 구글 클라우드 플랫폼을 이용하여 간단히 장소를 적으면 위도, 경도를 받는 프로그램을 만들어 볼 것이다. 물론 ip로 받는 방법도 있다. ip로 위도와 경도를 아는 방법은 아래의 url을 참고하자. han-py.tistory.com/235 python_ip를 통해 사용자 위치 파악하기 0. 들어가면서 빠르게 개발해야하는 개발자들을 위해 개념 설명없이 간단하게 핵심만 담았다. 방..
판다스의 read_html() 함수는 HTML 웹 페이지에 있는 태그에서 표 형식의 데이터를 모두 찾아서 데이터프레임으로 변환한다. 그리고 각각의 표를 원소로 가지는 리스트가 반환된다. 아래의 html이 있다고 하자. 코드를 보면 아래와 같다. c0 c1 c2 c3 0 0 1 4 7 1 1 2 5 8 2 2 3 6 9 name year developer opensource NumPy 2006 Travis Oliphant True matplotlib 2003 John D. Hunter True pandas 2008 Wes Mckinneye True html에 대한 자세한 설명은 생략하겠다. 관련 내용은 여기를 클릭하자. 그렇다면 이제 불러서 확인을 해보자. # html_file.html로 저장된 문서를 임..
JSON 파일은 데이터 공유를 목적으로 개발된 특수한 파일 형식이다. 파이썬 딕셔너리와 비슷하게 'key:value' 구조를 갖는다. 예제는 다음과 같다. 기본적인 파이썬의 json 라이브러리를 사용하는 방식은 여기를 눌러서 확인하자. 우리는 판다스로 json을 데이터 프레임으로 바꿀 것이다. 다음의 json 내용이 있다고 가정해 보자. # json_file.json 파일 내용 { "name":{"pandas":"", "NumPy":"", "matplotlib":""}, "year":{"pandas":2008, "NumPy":2006, "matplotlib":2003}, "developer":{"pandas":"Wes Mckinneye", "NumPy":"Travis Oliphant", "matplotl..
Excel 파일(.xlsx)의 행과 열은 데이터프레임의 행과 열로 일대일 대응된다. CSV 파일 열기와 마찬가지로 header, index_col 등의 대부분 옵션은 사용 할 수 있고 read_csv() 함수를 사용하여 연다. 불러올 엑셀 데이터는 아래와 같다고 가정해 보자. 전력량 전력별 2020 2021 2022 2033 남한 수력 63 24 52 45 화력 645 456 655 456 북한 수력 34 55 34 52 화력 152 123 166 122 # 발전량.xlsx를 불러온다. import pandas as pd # df1 = pd.read_excel('./발전량.xlsx') #output 전력량전력별 2020 2021 2022 2033 0 남한 수력 63 24 52 45 1 NaN 화력645 ..
판다스는 다양한 형태의 외부 파일을 읽어와서 데이터프레임으로 변환하는 함수를 제공한다. csv json xlsx등 다양한 파일 확장자를 판다스로 열 수 있다. 판다스의 기초는 아래와 같다. 2021/01/10 - [인공지능(Artificial Intelligence)/python] - [pandas] 판다스 기초 한번에 정리 CSV 파일 데이터 값을 쉼표(,)로 구분하고 있다는 의미로 CSV(comma-separated values)라고 부르는 텍스트 파일이다. 기본적으로 쉼표(,)로 열을 구분하고 줄 바꿈으로 행을 구분한다. 사용법은 판다스 read_csv() 함수에 확장자(.csv)를 포함하여 파일 결로를 입력하면 CSV 파일을 읽어봐서 데이터프레임으로 변환한다. 인덱스를 지정하는 옵션에는 heade..
판다스란 판다스를 사용하는 목적은 서로 다른 여러 가지 유형의 데이터를 **공통의 포맷**으로 정리하는 것으로, 여러 유형의 데이터를 공통의 포맷으로 만들기 위해, **시리즈**(1차원벡터)와 **데이터프레임**(2차원벡터, 행렬)이라는 구조화된 데이터 형식을 제공한다. 시리즈는 여기를 눌러서 간단히 확인 후에 다시 돌아오자. 사실 아래의 내용만 코드로 입력하고 이해한다면, 판다스를 이해하는데 무리가 없을 것이다. 데이터프레임(DataFrame) 판다스의 1차적인 목적은 서로 다른 여러 가지 유형의 데이터를 공통의 포맷으로 정리하는 것이다. 특히 행과 열로 이루어진 2차원 구조의 데이터프레임은 데이터 분석 실무에서 자주 사용된다. 2차원 배열구조는 엑셀이나 관계형 데이터베이스 등 다양한 분야에서 사용된다..
시리즈(Series) 1차원 배열의 형태로 인덱스와 데이터 값은 일대일 대응이 된다. 시리즈의 인덱스란 데이터 값의 위치를 나타내는 역할을 한다. 기본적으로 우리는 딕셔너리와 리스트를 시리즈로 바꾸는 방법을 알아볼 것이다. 딕셔너리 -> 시리즈 변환 pandas.Series(딕셔너리) 기본적인 구조는 위와 같다. 그리고 핵심은 딕셔너리의 카가 시리즈의 인덱스에 대응하고 value값은 시리즈의 데이터 값으로 변환된다. 시리즈를 구성하는 데이터 값의 자료형은 정수형(int64)이다. 인덱스와 데이터만 선택하는 것도 가능하다. # 인덱스 배열 선택하기 Series객체.index # 데이터 값 배열 선택 Series객체.values 리스트 -> 시리즈 변환 import pandas as pd list_data ..
+추가 공공데이터 불러오는 기초에 대한 글을 적기 이전에, 코로나 관련 API를 가지고 오는 질문이 많아서, 샘플 코드를 만들었다. 코드만 필요한 분들은 바로 아래의 URL을 참고하기 바란다. 2021.04.26 - [프로그램 언어/Python] - [공공데이터 API] 코로나 확진자 감염 현황 불러오는 코드 다 생략하고 핵심 위주로 진행해 보겠다. API(Application Programming Interface)란, 기기 간 통신을 통하여 데이터나 정보를 주고 받을 수 있는 것이다. 즉, 사이트끼리 정보를 주고 받는 것이라고 생각하면 된다. 이때 데이터 전송 시 아무꺼나 주는것이 아니라 약속으로 전해논 XML과 Json을 주로 사용한다. (JSON을 더 많이 사용한다.) 우리는 python을 이용해..
- Total
- Today
- Yesterday
- NextJS
- next.config.js
- nextjs autoFocus
- react autoFocus
- django
- read_csv
- DFS
- TensorFlow
- vuejs
- react
- 클라우데라
- nodejs
- 자료구조
- useState
- JavaScript
- UserCreationForm
- 자연어처리
- typescript
- Deque
- BFS
- error:0308010C:digital envelope routines::unsupported
- login
- Python
- useHistory 안됨
- Vue
- logout
- Queue
- mongoDB
- pandas
- Express
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |