목록전체 글 (73)
초보 개발자의 일기
7월 5일부터 시작된 3주간의 모각코 활동이 끝났다. 재미있는 시간이었다. 매일 짤막한 이론 공부를 하고 코드를 작성하는데, 끈기가 부족한 나에게 끈기와 꾸준함을 심어준 활동이었다. 처음 지원했을 때는 그저 JAVA가 너무 어려워서, 알아보고 싶은 마음에 지원을 하게 되었다. 아무래도 다른 공부하는 게 많다보니 금방 포기하게 될까봐 함께 공부하는 커뮤니티를 찾아봤고, 모각코에 지원했다. 미션으로 사용했던 사진인데, 날이 좋지 않다. 3주간 활동을 하면서 자바의 기초부터 심화라고 말할 수 있는 객체, 쓰레드까지 두루 공부하게 되었다. 혼자 공부했으면 이렇게 꾸준히 할 수 있었을까 싶다. 아마 아직도 변수 선언이나 스캔 부분을 보고 있었을 수도 있다. 사실 모각코가 디스코드에서 이루어졌는데, 내가 속한 팀의..
Cleaning and Normalization 코퍼스에서 용도에 맞게 토큰을 분류하는 작업이 앞서 포스팅 했던 '토큰화'이고, 토큰화 작업 전 후에는 데이터를 용도에 맞게 정리해주는 일이 함께한다. 정제는 코퍼스로부터 노이즈 데이터를 제거하는 것이고, 정규화는 표현방법이 다른 단어들을 통합시켜 같은 단어로 만들어 준다. '정규 분포'라는 단어와 '가우시안 분포'라는 단어가 있다. 이 둘은 같은 의미를 갖고 있으면서 표기가 다른다. KOR과 Korea 또한 표기가 다르지만 여전히 같은 의미를 지니고 있다. 정규화를 거치게 되면 둘 중 하나를 찾아도 함께 찾을 수 있게 된다. 영어권에서 대, 소문자를 통합하면 단어의 개수를 줄일 수 있다. 'Tea'와 'tea'가 있다. 이 둘은 다른 언어로 받아들여지는데..
크레인 인형 뽑기 문제는 2차원 배열에 대한 이해를 바탕으로 푸는 문제이다. 같은 인형이 두 개가 쌓이면 사라지는데, 사라진 인형의 개수를 return하는 문제이다. 백준 문제는 스토리가 재미있다. 사용한 언어는 Python3이다. 코딩테스트 연습 - 크레인 인형뽑기 게임 [[0,0,0,0,0],[0,0,1,0,3],[0,2,5,0,1],[4,2,4,4,2],[3,5,1,3,1]] [1,5,3,5,1,2,1,4] 4 programmers.co.kr def solution(board, moves): answer = 0; result = [] for i in moves: for j in range(0,len(board)): x = board[j][i-1] if x == 0 : continue result.a..
프로그래머스에서 처음 코딩문제를 풀어봤다. 일단 첫인상은... 어려웠다. 난이도 덕분에 풀다보니까 오기도 생기고 해서 열심히 풀어봤다. 정규표현식을 검색해서 풀어봤다. 정규표현식을 사용하니 코드가 간결해서 마음에 든다. 아이디를 입력받아 정해진 규칙에 맞게 변경하여 리턴하는 문제이다. 사용언어는 Python3 이다. 코딩테스트 연습 - 신규 아이디 추천 카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 programmers.co.kr import re def solution(new_id): # step1. 대문자를 소문자로 전환 new_id = new_id.lower() ..
커넥트재단에서 운영하는 부스트코스 코칭스터디(PY4E)에 선발되었다. 처음 지원할 때만 해도 선발이 안될까봐 조마조마했는데 생각보다 많은 인원을 선발한 것 같다. 부스트코스 코칭스터디 : PY4E '모두를 위한 파이썬(PY4E)'를 매주 수강하고, 팀원과 미션을 수행하며 코치의 피드백과 현업 개발자의 라이브강의를 시청하는 온택트 스터디 나는 '부스터'로 스터디에 참여하게 되었고 각 팀은 '리드부스터' 1명, 코치단, '부스터' 4명으로 이루어진다. 시작은 7월 15일 내일인데, 이전에 운영했던 코칭스터디 리뷰를 보니 조금...힘들었다는 이야기가 많았다. 그래도 파이썬을 좀 알고 복습하는 느낌으로 신청했기 때문에 즐겁게 참여할 수 있을 것 같다. 기반 강의인 PY4E를 조금 봤는데, 교수님이 'Atom'을..
Tokenizition 토큰(Token)이란 보통 화폐 대신에 유통되는 주조물 등을 말한다. 지금은 사용하지 않지만 버스 승차 시 사용했던 버스 토큰이나, 아직까지 사용되고 있는 지하철 토큰 등이 있다. 화폐의 경우 구겨지거나, 찢어지거나, 낙서가 되어 있어도 그 화폐의 가치는 변하지 않는다. 즉, 고유값을 가지고 있다. 그 고유값을 일정 모양의 주조물로 옮겨놓은 것을 토큰이라고 하는 것이다. (이것은 스스로 이해를 쉽게 하기 위해 생각해낸 예시이다.) 자연어처리에서의 토큰 또한 비슷한 개념이라고 생각하면 될 것 같다. 주어진 문장이나 큰 글에서 토큰(Token)이라 불리는 단위로 나누는 작업을 토큰화(Tokenization)라고 하며, 의미있는 부분을 토큰으로 정의한다. 다만 여기에서 의미있는 '부분'..