일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 저지
- 자바스크립트
- 설치
- 연결
- 알고리즘
- 배열
- Judge
- API
- r
- OrientDB
- Framework
- 프레임워크
- r script
- BAEKJOON
- 파이썬
- 오픈한글
- 토네이도
- spring
- mariadb
- 연동
- online
- ubuntu
- 이클립스
- MongoDB
- Tornado
- AWS
- 백준
- Python
- Java
- 자료형
- Today
- Total
목록머신러닝/고찰 (18)
맛동산
나에게... 안녕 나야?너의 마음대로 형용사에 감정수치를 부여하는게 마음에 안들어서 아예 다른 방법을 들고와봤어ㅎㅎㅎ 넌 문장 내 형용사와 명사간의 연결도가 얼만큼 되는지도 잘 모르잖아?ㅎㅎㅎㅎ 근데 문장 내 형용사 점수로 명사에 대한 호감도를 넣는건 뭔가 근거가 부족하지 않겠니ㅎㅎㅎ 자, 새로운 방식은 이거야 수집된 문장을 1. 호감 2. 비호감 3. 중립(이게 문젠데 이걸 모으면 분석이 좋아질지, 과적합이 될지 확신이 안서...)으로 분류할거야 근데 여기서 문장 전체를 DB넣는게 아니라 일단 분류기로 돌려서(트위터 분류기는 아쉽지만, 한나눔껄 쓰자... R에서도 KAIST님들이 만든 패키지를 쓰고 있거든) 명사(등)를 제외한 문장의 구조만 넣을 생각이야 그 영화 진짜 재밌더라 그 만화 진짜 재밌더라그..
너무 오랜만에 봤더니 뭐가 뭐였는지 기억이 안남ㅜㅜ 일단 정리를 해보자면 1. sample.txt는 특정 기간동안의 대화만 수동으로 뽑은거고KakaoPreProcess_ver1.py / KakaoPreProcess_ver2.py는 sample을 대상으로 작업을 수행하는 모듈. 2. KakaoTalkChats.txt는 대화방의 모든 대화가 들어있는 파일이고AllChatPreProcess.py는 KakaoTalkChats를 대상으로 작업을 수행하는 모듈(이게 좀 더 큰 범위)문장 당 명사, 형용사를 result.txt라는 파일에 쓰는데, list를 그대로 넣었더니 '[]'이 텍스트 꼴로 저장되서다시 불러올 때 list로 형변환이 안됐었던 것 같음 -> 확인 후 수정하기 3. DBProcess_ver1.py ..
스프링이다 프로젝트다 뭐다 해서 작업 못한지 2달이 다 되가네ㅜㅜ 우선 저번 작업 이후로 해야할일을 생각해보니 우선 발생한 형용사 목록을 따서 감정 가중치 테이블을 작성해야함. 이 부분은 한글로 된 정보를 구하기 힘드니(오픈한글.. 거의 5달째? 권한 없다고만 나오고 문의해도 답장이 없으무ㅜ) 기존에 영어로 된 감정표를 번역기 + KoNLp를 통해 작성하는것도 하나의 방법으로 사용 가능할 듯 문장 내 명사에 대한 점수 모듈은 차후에 하기로. 너무 늦었지만 일단 플로우 차트를 만들어본다면 얼추 요런느낌? 일단 명사, 형용사 추출 모듈까지는 완성됐으니 result파일로 작업 '처음 발견된 용언인가?' 부분부터 시작하면 될 듯 3.15)음.. 형용사의 긍정, 부정 점수를 입력하는데에 뭔가 기준치가 있어야 할 ..
일단 2가지 추출기 제작. 두번째 추출기 결과에 나온 형용사를 설계 DB들에 넣어보고 분석해야할듯 근데 형용사 점수가 들어갈 테이블이 없네?(Maria.sql 9 line) 1.분석결과를 보다가 느낀건데 '영화표 뽑는게 너무 오래걸려서 싫다'라는 데이터에서 '영화표' ... '싫다' 라는 결과가 나오면(아직 명사와 형용사 관계를 파악하는 수준으로 연구중) '영화표'가 싫은게 아니라 '영화표를 뽑는 행위'가 '오래걸려서' '싫다'라는 의미를 갖기 때문에 잘못된 결과가 아닌가 생각했음. 근데 사실 심리학적으로 생각한다면 무의식적으로 영화표라는 대상에 거부감을 느끼게 될 수 있지 않을까? 하는 생각이 번쩍 들었음. 문장에 대한 사실만 분석할 것이 아니라 심리적인 측면도 고려해야 진정한 의미의 인공지능을 이뤄낼..
단계별 과제1단계 - 대화에 포함된 명사에 대한 호감도 분석2단계 - 대화 상대별 대화 패턴 분석3단계 - 2단계를 토대로 상대방에 대한 호감도 분석 1단계 처리를 어떻게 하나.. 생활 대화 수집에 한계가 있고 혼자 코퍼스를 분류하기엔 해야할일이 너무 많음 -> KoNLPy를 사용 twitter 분류기의 sentences를 사용하여 최대한 하나의 문장으로 나눈뒤 다른 분류기로 분류(최대한 잘게 나눠야 명사를 수식하는 형용사의 거리가 가까울테니) 형용사 사전을 어디서 구한담.. 분류기로 나온것들만 저장?(분류기로 나온 형용사들도 가중치처리를 직접해줘야함...) 일단 좌표http://www.korean.go.kr/front/page/pageView.do?page_id=P000160&mn_id=26http:/..
형태소 분석기에 나오는 pos란 무엇인가??
원래의 방향성을 생각해보면 사실 챗봇과의 대화가 중요한게 아님 챗봇은 나중에 대화형 인터페이스로 된 연애코치 봇으로 제작하기 위한 밑거름이고 중요한건 대화 내용을 자연어 처리를 해서 특정 명사에 대한 호감도, 생활패턴 분석 등을 해야함 카카오 대화 익스포트해서 처리?파이썬 자연어 처리 모듈도 찾아봐야될것같고단순 모듈로는 원하는데로 맞춰나가기가 힘들까? 일단 명사 분류기? 같은걸 찾아봐야할듯-> 명사분류 + 감정분류(동사?)
http://rconference.fossa.kr/handout/sentiment_analysis_hyungjunkim.pdflibrary(KoNLP)library(tm)library(ggraph) 불필요(stopwords) 단어사전 ? library(networkD3) - 형태소 분석 및 단어 파싱tm / tau / NLP / openNLPKoNLP - 감정사전tm.plugin.sentimenthttp://mpqa.cs.pitt.edu/lexicons/subj_lexicon/http://word.snu.ac.kr/kosac/http://clab.snu.ac.kr/arssa/doku.php?id=app_dict_1.0http://www.openhangul.com/ library(lda)library(to..