Numpy 기초 1. NumPy 배열 NumPy는 과학 연산을 위한 파이썬 핵심 라이브러리 NumPy는 고성능 다차원 배열과 이런 배열을 처리하는 다양한 함수와 툴을 제공 사용법 import numpy as np 버전확인 np.__version__ NumPy 배열구조는 Shape이다 배열은 파이썬 튜플 자료형을 이용하여 정의한다. shape가 (28, 28, 3)이라면 3차원 배열이고 사진은 높이가 28, 폭이 28, 각 픽셀은 4개 채널(RGB)로 구성된 데이터 구조를 갖는다. 다차원 배열은 입체적인 데이터 구조를 가지고 데이터의 차원은 여러 갈래의 데이터 방향을 갖는다. 이때 데이터 방향은 axis로 표현할 수 있다. 향방향(높이), 열방향(폭), 채널 방향은 각각 axis=0, axis=1 그리고 ..
0. 들어가면서 NLP에 대해서는 할 이야기가 상당히 많다. 그러나 상세히 설명하기엔 너무 복잡하므로 간단히 하고 추가는 다른 페이지로 하겠다. NLP는 단어 문장 문서로 이야기를 많이 한다. Word, Sentence, and Document Embedding 말의 가장 작은 단위가 word고 word가 모여서 Sentence가 되고 Sentence가 모여서 Document가 된다. 모든 과정에서 의미를 추출하는 것이 NLP의 궁극적인 목표이고, 그것을 어떻게 하는지에 대해 가장 중요하게 연구되는 부분이 Embedding이다. 그중에서 오늘은 word Embedding에 대해서만 볼 거다. word Embedding 단어 하나에 대해서 꽤 많은 dimension을 가진 벡터로 표현을 하는 것이다. 앞에..
0. 들어가면서 분류 문제로 다시 들어가 보자. 이번에 적을 모델은 Naive bayes(나이브 베이즈)라는 모델이다. 이 모델의 특징은 2가지이다. 이 모델은 컴퓨터가 분류를 했을 때, 사람이 직관적으로 판단이 가능하다. 굉장히 많은 머신러닝 연구에서 Naive Bayes 모델을 기본 모형으로 사용한다. 그러나 모델이 나온 지 오래된 모델이고 간단한 모델이라 결과는 그렇게 좋지 않다. 그러나 모델의 기준값인 base라인으로 대부분이 사용한다. ex_ "Naive Bayes 모델로 60% 로가 나왔다. 이거보다는 잘 나와야 하지 않겠냐?" 이러한 느낌으로 사용한다. Features Features란 분류를 하기위해 기준이 되는 성질이나, data detail 정도로 생각할 수 있다. 즉, image는 픽..
회귀모델은 연속형 타겟 변수(continuous target variable)과 여러 입력 변수들(input variables)의 관계를 만드는 모델이다. 사실 f의 구조, 학습 방법에 따라 다양한 종류의 회귀모델이 존재한다. y = f(x1, x2, x3, ..., xp) 적용 가능한 예로는 중고차 가격 예측, 주식 가격 예측, Object detection 등등이 있다. Linear Regression Linear Regression가 무엇인지 알아보자. Regression의 핵심은 선택지가 1, 2, 3, 4번 중에 있어서 고르는 게 아니고 x값에 대한 y값이 실수로 주어지는 것이다. ex_ 집의 평수에 따른 가격. 그리고 Regression 중에 Linear Regression이 가장 쉽다. 사실..
0.들어가면서 딥러닝을 하다 보면 다양한 데이터 유형을 다루게 된다. 이 때 선형대수 연산에 numpy의 sum 함수를 사용하면 매우 편리하다. 데이터 유형 스칼라 - 보통 x와 같은 알파벳 소문자로 표기한다. 벡터 - 여러 숫자가 모여 있어 일반적으로 일차원 배열이 벡터이다. 행렬(matrix) - 복수 차원을 가지는 데이터가 여러 개 있는 경우의 데이터를 합쳐서 표기한 것이다. 일반적으로 2차원 배열이고 3차원 이상의 배열은 텐서(tensor)라고 한다. 실습 >>> arr = np.arange(0, 32) >>> len(arr) 32 >>> arr array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,..
0. 들어가면서 프로젝트 안의 accounts 앱 안의 코드를 정리한 것이다. 코딩 시 참고만 하기 바라며 이전에 내용들을 따라 하나씩 따라오길 추천한다. 1. urls.py app_name = 'accounts' urlpatterns = [ path('signup/', views.signup, name='signup'), path('login/', views.login, name='login'), path('logout/', views.logout, name='logout'), path('/', views.detail, name='detail'), path('delete/', views.delete, name='delete'), path('update/', views.update, name='updat..
0.들어가면서 이 게시물에서는 좋아요와 팔로우기능이 MTM(manytomany)을 통해 DB로 table이 생성될 때 자동으로 생성되는 column의 naming에 대해 알아볼 생각이다. 이 부분을 보기 전에 좋아요 기능가 팔로우 기능에 대한 개념을 모른다면 아래의 링크를 타고가서 공부하고 오자. https://han-py.tistory.com/160 https://han-py.tistory.com/161 결론부터 보면 좋아요 기능의 column명은 아래와 같다. article_id user_id [table] accounts_user_followers from_user_id to_user_id 공식문서를 통해 ManyToMany를 살펴보면 아래와 같다. ManyToManyField If you don'..
0. 들어가면서 음성인식 관련해서 좋은 모델은 아니지만, 구현하여 첫 머신러닝을 돌렸다는 자심을 을 가지고 오픈소스에 등록하려는 과정 속에서 오픈소스로 만들고 라이선스도 등록하고 필요한 과정들이 무엇이 있을까 검색을 하였고, 필요한 과정을 적어보려 한다. 물론 영어를 잘하면 아래의 사이트에 들어가서 읽어보는 것도 추천한다. 여기서는 필요한 내용만 요약해서 올리는 방향으로 진행을 하겠다. https://opensource.guide/starting-a-project/ Starting an Open Source Project Learn more about the world of open source and get ready to launch your own project. opensource.guide 1...
- Total
- Today
- Yesterday
- JavaScript
- react
- nodejs
- Python
- mongoDB
- BFS
- UserCreationForm
- vuejs
- login
- typescript
- nextjs autoFocus
- read_csv
- error:0308010C:digital envelope routines::unsupported
- logout
- 자연어처리
- 자료구조
- django
- Queue
- TensorFlow
- pandas
- Vue
- 클라우데라
- useHistory 안됨
- next.config.js
- react autoFocus
- NextJS
- DFS
- Deque
- useState
- Express
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |