일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- r script
- Python
- mariadb
- online
- 자바스크립트
- 이클립스
- 배열
- 알고리즘
- 토네이도
- Judge
- 자료형
- 백준
- 설치
- Java
- r
- 연결
- MongoDB
- 프레임워크
- Framework
- ubuntu
- 저지
- OrientDB
- AWS
- API
- Tornado
- 연동
- spring
- 파이썬
- 오픈한글
- BAEKJOON
- Today
- Total
목록머신러닝 (57)
맛동산
원래의 방향성을 생각해보면 사실 챗봇과의 대화가 중요한게 아님 챗봇은 나중에 대화형 인터페이스로 된 연애코치 봇으로 제작하기 위한 밑거름이고 중요한건 대화 내용을 자연어 처리를 해서 특정 명사에 대한 호감도, 생활패턴 분석 등을 해야함 카카오 대화 익스포트해서 처리?파이썬 자연어 처리 모듈도 찾아봐야될것같고단순 모듈로는 원하는데로 맞춰나가기가 힘들까? 일단 명사 분류기? 같은걸 찾아봐야할듯-> 명사분류 + 감정분류(동사?)
- R을 연동하여 유클리드언 유사도? 기법을 사용하여 문장의 연관관계를 측정. 유사 질문에 대한 답변 레코드를 출력해줌- 서블릿에서 select * 를 list에 담음, list의 getQue를 string으로 이어붙임, R을 수행할 class에 보내서 입력값(input)과 que_list 값들의 유사도 백터를 구함, 그것의 index를 리턴해서 list.get(index).getAns()를 리스폰스함 notice)저장 레코드가 무수히 많을 경우 Que를 리턴받고 다시 select ans from que={Que}를하면 select를 중복 수행해야하는 부담감이 있어서 select *후 index로 접근하게 하려고 했던건데이 경우 답변의 다양성을 만족시키지 못함 예)문 답안녕 -> 안녕하세요안녕 -> 반가..
- que(질문)의 공백, 특수문자를 제거한 que_trim 컬럼을 만들어서 안녕! 안녕!!!에 대해 같은 레코드를 매칭시도록 함- select 작업을 like %{que_trim}%로 하여 포함되는 질문에 대해 대응하도록 함 notice)like의 경우 ㅋㅋㅋ이 있을때 ㅋㅋㅋㅋㅋㅋ이 들어오면 대응하지못함.
- http://tastydarr.tistory.com/36 에 명시된 기능 완료- 입력된 질문에 일치하는 대답에 대하여 답변가능 notice)ㅋㅋㅋㅋ의 답변을 입력해도 ㅋㅋ에는 대응이 불가능함사용성이 떨어져서 데이터 수집 목적마저 달성하기 어려움
후.. 하루 밤새서 겨우완성..rjava는 Rengine 객체 2번이상 호출이 안되는걸 알게됨.. Rserve 만세! - R 콘솔에서library(Rserve)Rserve(FALSE,port=6311,args='--RS-encoding utf8 --no-save --slave --encoding utf8 --internet2')Rserve(args="--RS- encoding utf8") 피곤하다.. ver2 작업한건 자세한건 내일 정리해서 올리자ㅠㅠ
http://rconference.fossa.kr/handout/sentiment_analysis_hyungjunkim.pdflibrary(KoNLP)library(tm)library(ggraph) 불필요(stopwords) 단어사전 ? library(networkD3) - 형태소 분석 및 단어 파싱tm / tau / NLP / openNLPKoNLP - 감정사전tm.plugin.sentimenthttp://mpqa.cs.pitt.edu/lexicons/subj_lexicon/http://word.snu.ac.kr/kosac/http://clab.snu.ac.kr/arssa/doku.php?id=app_dict_1.0http://www.openhangul.com/ library(lda)library(to..
어떻게 발전시킬것인가.. 1. 아예 언어에 대한 개념을 학습시켜서 통계 확률과 결정이 아닌 직접 말할 수 있도록? 2. 키워드에 따른 명령행위?(날씨 알려줘 등) 3. 계정 생성으로 사람을 기억하고 이전 대화 내용을 기억하고 그 사람의 특정 명사에 대한 호감도 등으로 성격부여?
머신러닝 순환주기(획득 - 데이터 수집, 준비 - 데이터 정리 및 품질 검증, 처리 - 기계 학습 수행, 보고 - 결과 제시)에 따라서 그동안 만든걸 정리하면 좋을 것 같음