아래의 내용은 파이썬 알고리즘 인터뷰 책을 참고하여 작성하였다. 코딩 테스트에서 점수를 받으려면, 주어진 문제를 에러 없이 주어진 시간 안에 정해진 정답을 출력해야 한다. 따라서 우리가 집중을 해야 할 부분은 첫째, 정답을 도출해 낼 수 있는 알고리즘을 짜야한다. 둘째, 주어진 시간 안에 코딩 정답을 도출해야 한다. 이러한 2가지 포인트에 집중하여, 아래의 글을 읽어주기 바란다. 문자열 유형 코딩 테스트에서 주로 1번 문제로 등장하는 문자열에 대해 정리해보고자 한다. 아래의 유형이 나오면 5분 안에 풀고 넘어가면 된다. 물론 아래의 유형으로 문자열을 요구사항에 맞게 정렬 후 다른 유형과 결합되어 나오기도 한다. 유형 1. 회문(Palindrome) 회문, 즉 팰린드롬이란 앞뒤가 똑같은 단어나 문장을 의미..
1. 데이터베이스(database)란 데이터베이스라는 말을 처음 들으면 무슨 말인지 잘 안와 닿는다. 데이터베이스라는 말보다 DB라는 말이 더 와 닿는 것 같다. 결론부터 말해보면, 컴퓨터 언어를 사용하여 표형식으로 이루어진 file의 데이터를 생성, 수정, 삭제, 읽기를 할 수 있는 총칭이라고 생각하면 좋을 것 같다. 컴퓨터에서 정보를 저장하려면 file을 사용한다. 데이터가 많아지고 복잡해지면서 file만으로는 효과적으로 정보를 찾기 어려웠다. 그래서 잘 정리 정돈해서 쉽게 꺼내쓸 수 있게 하기 위해서 만들어진 소프트웨어가 데이터베이스라고 한다. 즉, 일정한 체계 속에 저장된 데이터의 집합이라는 의미이다. DATA는 데이터안에서 Table(표)이라는 단위로 저장이 된다. 2. 스프리드시트(Spread..
로지스틱 회귀에 대한 개념과 코드, 발생하는 오류까지 전부를 정리하겠다. 기초 개념 로지스틱 회귀(Logistic Regression)는 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘이다. 주의해야할 점은 로지스틱 회귀에 회귀가 들어간다고 회귀문제가 아니다. 단지 회귀(Regression)원리를 사용하여 분류(classification)을 하기 때문에 이름에 회귀가 포함된 것이다. 즉, 로지스틱 회귀는 분류라고 할 수 있다. 먼저 로지스틱 회귀와 선형회귀는 다르다. 선형회귀는 공부시간과 성적의 관계를 직선으로 나타내서 예측하는 것이다. 로지스틱 회귀는 데이터가 어떤 범주에 속할 확률..
머신러닝에 대한 기초적인 개념을 정리하고, 데이터를 가져와서 판다스로 전처리 후에 사이킷런을 이용하여 모델을 만들고 분석을 해볼 것이다. 출퇴근하면서 핸드폰으로 쭉 보는 것을 추천한다. 머신러닝 프로세스 머신러닝 데이터 분석을 하기 위해서 컴퓨터 알고리즘이 이해할 수 있도록 관측값(observation)을 속성(feature)기준으로 정리가 필요하다. 따라서 판다스를 이용하여 정리가 필요하다. 데이터프레임에서 열은 속성을 나타내는 변수고, 행은 하나의 관측값이다. 데이터프레임으로 정리를 했으면, 모형을 학습하기 위해 사용되어지는 훈련 데이터(train data)와, 학습이 마친 모형의 예측 능력을 평가하기 위한 검증 데이터(test data)로 나눠줘야 한다. 기본적으로 판다스에 대한 설명은 아래의 ur..
확률에 대해 공부해 보자 경우의 수 어떤 사건에 대하여 일어날 수 있는 모든 경우에 대한 가짓수를 의미한다. P(확률) = (사건 A가 일어나는 경우의 수) / (모든 경우의 수) 예제를 통해 익혀보자. 주사위를 던졌을때 짝수가 나올 확률 구하기 def probability(space, event): return len(event)/len(space) space = {1, 2, 3, 4, 5, 6} event = {2, 4, 6} result = probability(space, event) print(result) ''' 0.5 ''' 1~20까지 써있는 주사위를 던졌을때 3의 배수가 나올 확률 def probability(space, event): return event/space def Multip..
urllib 파이썬에서는 웹과 관련된 데이터를 쉽게 다룰 수 있도록 urllib모듈을 제공한다. python2 버전에서의 urlparse가 python3에서는 urllib.parse로 변경됐다. docs.python.org/3/library/urllib.html#module-urllib urllib — URL handling modules — Python 3.9.1 documentation docs.python.org 위의 내용이 공식문서이다. 아래의 내용은 자주 사용하는 내용위주로 정리해 보겠다. 공식문서에서 볼 수 있듯, urllib은 모듈을 핸들링하는 URL이라고 적혀있다. urllib의 모듈에는 urllib.request, urllib.error, urllib.parse, urllib.robotp..
우리는 파이썬의 딕셔너리를 엑셀파일로 만들기위해 판다스를 활용할 것이다. 판다스 기초는 여기를 눌러서 확인해보자. exel 파일로 저장할 때는 to_excel() 메서드를 적용한다. 아나콘다에서는 openpyxl 라이브러리가 사전에 설치되서 바로 사용하면 되지만, 만약 to_excel()이 안된다면, 아래와 같이 파이썬 라이브러리를 설치하자. $ pip install openpyxl 이제 코드를 작성해 보자. import pandas as pd data = {'name' : [ 'Jerry', 'Riah'], 'algol' : [ "A", "A+"], 'basic' : [ "C", "B"] } df = pd.DataFrame(data) df.set_index('name', inplace=True) #na..
파이썬의 딕셔너리를 CSV 파일로 만드는 방법을 배워보자. 과정은 파이썬의 딕셔너리를 판다스의 데이터프레임으로 바꾼다. 그리고 데이터프레임을 to_csv() 메소드를 활용하여 저장한다. 예제를 보면 간단하다. 그러나 저장되는 형식에 대해서도 직관적으로 설명해 보겠다. CSV파일 여는 방법은 아래의 링크를 참고하자. 2021/01/09 - [인공지능(Artificial Intelligence)/python] - [pandas] 시리즈(Series) 기초정리 2021/01/10 - [인공지능(Artificial Intelligence)/python] - [pandas] 판다스 기초 한번에 정리 2021/01/11 - [인공지능(Artificial Intelligence)/python] - [pandas] c..
- Total
- Today
- Yesterday
- NextJS
- react autoFocus
- pandas
- react
- 자연어처리
- Deque
- UserCreationForm
- 자료구조
- mongoDB
- Queue
- Express
- django
- useState
- 클라우데라
- vuejs
- login
- error:0308010C:digital envelope routines::unsupported
- nodejs
- nextjs autoFocus
- Python
- JavaScript
- DFS
- typescript
- Vue
- TensorFlow
- next.config.js
- useHistory 안됨
- read_csv
- logout
- BFS
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |