일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Batch Normalization
- 비지도학습
- Normalization
- 정밀도
- sorted
- five lines challenge
- layer normalization
- NULLIF
- NVL
- 강화학습
- ifnull
- 결정트리
- 평가 지표
- 재현율
- 감정은 습관이다
- 빠르게 실패하기
- 웹서비스 기획
- 지도학습
- CASE WHEN
- nvl2
- LAG
- 오차 행렬
- 데이터 전처리
- SQL
- 데이터 분석
- 백엔드
- recall
- beautifulsoup
- 데이터 프로젝트
- DecisionTree
- Today
- Total
목록전체 글 (63)
Day to_day
보통 현업에선 이미지 데이터의 경우 클라우드를 많이 이용한다고 한다. 또는 DB에 저장을 해두고 해당 이미지의 경로를 프런트로 넘겨주는 방법을 사용한다고 하는데 우린 데이터가 800개가 넘었기 때문에 그 모든 이미지를 DB에 저장해 둘 수 없었다. (무료로 쓰고 있었기 때문에 용량이 크진 않았다..) 클라우드를 쓰자니 무료 클라우드 서비스를 찾지 못해 이미지 url로 불러오기로 결정했다. 웹페이지에 띄울때 최대 6개 정도의 레시피를 보여줄 거기 때문에 url을 가져오는 사이트로부터 block을 당하지 않을 거라고 판단했기 때문이다. 그러면 이제 이미지 url을 DB에 저장해야하는데 우리가 갖고 있는 정보라곤 해당 레시피의 사이트 주소만 있었다. 결국 크롤링 작업이 필요한 것..! 이전에 object de..
캐글 데이터를 사용하기 위해서 전처리 단계가 필수적으로 요구된다. 저번엔 데이터를 살펴보고 어떻게 데이터 전처리를 할 것 인가를 봤고, 이번엔 정규표현식으로 활용한 데이터 전처리를 진행해보았다. 사실 정규표현식이 무엇인지도 모르는 상태였으며, 단지 정규표현식을 이용해서 문자열의 규칙을 찾아서 하는 편이 쉽다는 이야기를 들어 시도해보았다. (그래서 코드가 깔끔하진.. 못하다ㅠ) 블로그 글이랑 공식문서들을 보면서 하나씩 해보긴 했는데 글을 쓰는 지금도 어렵다고 느낀다... 생각지도 못한 부분에서 시간을 굉장히 잡아먹었던 기분이다. 그러면 우선 정규표현식이 어떤 것인지에 대해서 알아보자 정규 표현식 정규표현식은 패턴(규칙)을 갖는 문자열의 집합을 표현하는 데에 사용되는 기법. 주로 복잡한 문자열에서 특정한 패..
HackerRank 문제 Basic 부분은 얼추 다 풀어서 medieum 단계를 풀고 있는데 확실히 난이도가 급상승한 것 같다ㅠㅠㅠ 오늘은 한 문제밖에 풀지 못했지만 대충 알곤 있었지만 활용해보지 못한 문법들이 있어서 고민하고 또 정리하면서 시간을 보냈던 것 같다. 오늘 고민했던 문제! Occupations라는 주제의 문제이다. 지시 사항 Pivot the Occupation column in OCCUPATIONS so that each Name is sorted alphabetically and displayed underneath its corresponding Occupation. The output column headers should be Doctor, Professor, Singer, and..
프로그래머스 문제를 풀면서 오늘도 어려웠던 것 중에 재귀 쿼리? WITH RECIRSIVE라는 것을 처음 봤다! 이렇게 처음보는 문법 같은 경우엔 신기하기도 하고, 내가 배운 파이썬이랑은 또 어떤 점이 비슷한지 비교하면서 배우면 더욱 빨리 습득할 수 있는 것 같다. 그래서 오늘도 정리를 해보잣! 지시사항 보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알아보려 합니다. 0시부터 23시까지, 각 시간대별로 입양이 몇 건이나 발생했는지 조회하는 SQL문을 작성해주세요. 이때 결과는 시간대 순으로 정렬해야 합니다. 정답 코드 WITH RECURSIVE NUMBER AS ( SELECT 0 AS N UNION ALL SELECT N+1 FROM NUMBER WHERE N < 23 ) SELECT N, CO..
프로그래머스 SQL 알고리즘 문제를 풀면서 대충은 알고 있었지만 사용하기엔 익숙지 않은 문법이 나와서 한번 정리를 해보려고 한다. 우선 문제와 정답 코드 및 출력결과를 보자 지시사항 중성화된 동물은 SEX_UPON_INTAKE컬럼에 'Neutered' 또는 'Spayed'라는 단어가 들어있습니다. 동물의 아이디와 이름, 중성화 여부를 아이디 순으로 조회하는 SQL문을 작성해주세요. 이때 중성화가 되어있다면 'O', 아니라면 'X'라고 표시해주세요. 정답 코드 SELECT ANIMAL_ID, NAME, (CASE WHEN (SEX_UPON_INTAKE LIKE 'Neutered%') OR (SEX_UPON_INTAKE LIKE 'Spayed%') THEN 'O' ELSE 'X' END) AS 중성화 FRO..
데이터 전처리 비건 레시피를 제공하는 웹서비스에서 가장 중요한 것은 충분한 비건 레시피 데이터일 것이다. 데이터를 모두 수집할 순 없으니 kaggle에서 비건 레시피 데이터를 사용했다. Vegan Recipes Recipes crawled from different vegan recipes websites www.kaggle.com 간단히 데이터를 살펴보자면 아래와 같다. 데이터 기본 정보 href : 해당 레시피 링크 (veganuary.com, simple-veganista.com) title : 레시피 제목 ingredients : 재료 preparation : 조리 과정 여기서 "href"는 웹서비스에 직접적으로 보이진 않지만 이미지 크롤링을 진행하기 위해 따로 빼두어야 하는 정보이고, title..