| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- string
- 자바
- 코세라
- 부스트캠프
- Clean Code
- Java
- 데이터사이언스
- 코딩테스트
- 문자열
- 클린코드
- 데이터 사이언스
- Python
- AI Mathematics
- IBM
- 소프티어
- 프로그래머스
- 코테
- 알고리즘
- programmers
- Data Science
- data science methodology
- 티스토리챌린지
- 깨끗한 코드
- softeer
- 데이터과학
- 클린코드 파이썬
- 파이썬
- Coursera
- Boostcamp AI
- 오블완
- Today
- Total
목록전체 글 (77)
떼닝로그
2019 KAKAO BLIND RECRUITMENT Level 2 오픈채팅방 문제 링크 : https://programmers.co.kr/learn/courses/30/lessons/42888 코딩테스트 연습 - 오픈채팅방 오픈채팅방 카카오톡 오픈채팅방에서는 친구가 아닌 사람들과 대화를 할 수 있는데, 본래 닉네임이 아닌 가상의 닉네임을 사용하여 채팅방에 들어갈 수 있다. 신입사원인 김크루는 카카오톡 오 programmers.co.kr 💡 아이디어 💡 문제를 어떤 방식으로 해결하려 했는지 그 과정을 적어주세요. 초기에 접근한 방법과 최종 접근이 차이가 없으면 한개만 적어도 됩니다. 초기 접근 생각보다 오래걸렸다. 다 하고 나니 뭐 이런 걸로 시간을 오래 끈 거야 싶은... 그냥 무지성 코딩의 절정을 찍은..
2020 카카오 인턴십 Level 1 키패드 누르기 문제 링크 : https://programmers.co.kr/learn/courses/30/lessons/67256 코딩테스트 연습 - 키패드 누르기 [1, 3, 4, 5, 8, 2, 1, 4, 5, 9, 5] "right" "LRLLLRLLRRL" [7, 0, 8, 2, 8, 3, 1, 5, 7, 6, 2] "left" "LRLLRRLLLRR" [1, 2, 3, 4, 5, 6, 7, 8, 9, 0] "right" "LLRLLRLLRL" programmers.co.kr 💡 아이디어 💡 문제를 어떤 방식으로 해결하려 했는지 그 과정을 적어주세요. 초기에 접근한 방법과 최종 접근이 차이가 없으면 한개만 적어도 됩니다. 초기 접근 모든 키패드를 하나의 2차원..
2020 KAKAO BLIND RECRUITMENT LEVEL 2 문자열 압축 문제 링크 : https://programmers.co.kr/learn/courses/30/lessons/60057 코딩테스트 연습 - 문자열 압축 데이터 처리 전문가가 되고 싶은 "어피치"는 문자열을 압축하는 방법에 대해 공부를 하고 있습니다. 최근에 대량의 데이터 처리를 위한 간단한 비손실 압축 방법에 대해 공부를 하고 있는데, 문 programmers.co.kr 💡 아이디어 💡 문제를 어떤 방식으로 해결하려 했는지 그 과정을 적어주세요. 초기에 접근한 방법과 최종 접근이 차이가 없으면 한개만 적어도 됩니다. 초기 접근 처음에는 단순하게 빈 문자열을 하나 생성해서 거기에 한 글자씩 더해가면서 매번 비교를 하려고 했다. 이렇..
Sequence 데이터 이해하기 소리, 문자열, 주가등의 데이터를 시퀀스 데이터로 분류 시퀀스 데이터는 독립동등분포(i.i.d) 가정을 잘 위배하기 때문에, 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀜 개가 사람을 물었다 / 사람이 개를 물었다 순서 바뀜으로써 data의 확률 분포 변함. 과거의 정보로 update하기 어려워짐 Sequence 데이터 다루기 이전 시퀀스의 정보를 가지고 앞으로 발생할 데이터의 확률분포를 다루기 위해 조건부확률 이용 결합확률분포 = \(x_t\)에 대한 확률분포 * 결합확률 조건부확률은 과거의 모든 정보를 사용하지만, 시퀀스 데이터를 분석할 때 모든 과거 정보들이 필요한 것은 아님 시퀀스 데이터를 다루기 위해서는 길이가 가변적인 데이터를 다룰 수 있..
Convolution 연산 이해하기 Convolution 연산은 Kernel을 입력벡터 상에서 움직여가면서 선형모델과 합성함수가 적용되는 구조 고정된 가중치 커널 V를 입력벡터 상에서 움직여가면서 계산 적용 활성화 함수를 제외한 Convolution 연산도 선형변환에 속함 kernel이 공통적으로 적용되기 때문에, parameter size 줄일 수 있음 Convolution 연산의 수학적인 의미는 신호를 커널을 이용해 국소적으로 증폭 또는 감소시켜서 정보를 추출 또는 필터링하는 것 f : 커널 / g : 신호 / z : 커널의 범위 / x - z : 신호의 term CNN에서 사용하는 연산은 사실 convolution이 아니라 cross-correlation 위의 식에서 -로 되어있는 부분 +로도 변환..
조건부 확률 사건 B가 일어난 상황에서 사건 A가 발생할 확률 P(A∩B) = P(B)P(A|B) 베이즈 정리는 조건부확률을 이용하여 정보를 갱신하는 방법을 알려줌 A라는 새로운 정보가 주어졌을 때 P(B)로부터 P(B|A)를 계산하는 방법 제공 예제를 통한 베이즈 정리의 이해 아래는 베이즈 정리를 위한 식 θ : model에서 계산하고 싶어하는 parameter(모수). hypothesis \(D\) : 새로 관찰하는 data 사후확률 : data가 주어져있을 때 parameter θ가 성립할 확률 사전확률 : modeling 전 사전에 주어진 확률 가능도(likelihood) : 현재 주어진 parameter(모수)를 가정해서 이 data가 관찰될 확률 계산 Evidence : data 자체의 분포 ..
모수 통계적 모델링은 적절한 가정 위에서 확률분포를 추정(inference)하는 것이 목표 유한한 개수의 데이터에서 관측하여 정확하게 알아내는 것은 불가능하므로, 근사적으로 확률분포를 추정해야 함 예측모형의 목적은 데이터와 추정 방법의 불확실성을 고려해서 위험을 최소화하기 위함 어떤 가정을 미리 부여하는지 아닌지에 따라 모수적, 비모수적 방법론으로 나뉨 데이터가 특정 확률분포를 따른다고 선험적으로(a priori) 가정한 후, 그 분포를 결정하는 모수(parameter)를 추정하는 방법을 모수적(parametric) 방법론 특정 확률분포를 가정하지 않고, 데이터에 따라 모델의 구조 및 모수의 개수가 유연하게 바뀌면, 또는 모수의 개수가 무한할 때 비모수(noparametric) 방법론 확률분포 사용 예시..
딥러닝에서의 확률론 딥러닝은 확률론 기반의 기계학습 이론에 바탕 기계학습에서의 손실함수(loss function)들의 작동 원리는 데이터 공간을 통계적으로 해석해서 유도 - 예측이 틀릴 위험(risk)을 최소화하기 위해 회귀 분석에서 손실함수로 사용되는 L2-norm은 예측오차의 분산을 가장 최소화하는 방향으로 학습 분류 문제에서 사용되는 교차 엔트로피(cross-entropy)는 모델 예측의 불확실성을 최소화하는 방향으로 학습 분산 및 불확실성을 최소화하기 위해서는 측정하는 방법을 잘 선택해야 함 확률분포는 data 해석에 있어서 굉장히 중요한 도구로 쓰임 이산확률변수 vs 연속확률변수 확률변수는 확률분포 D에 따라 이산형(discrete)과 연속형(continous) 확률변수로 구분 이산확률변수와 연..