일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- r
- 백준
- MongoDB
- 파이썬
- 오픈한글
- BAEKJOON
- Framework
- Python
- AWS
- Judge
- r script
- 배열
- 연동
- ubuntu
- 자바스크립트
- OrientDB
- 저지
- 토네이도
- 프레임워크
- 이클립스
- 연결
- 알고리즘
- mariadb
- 자료형
- online
- Tornado
- Java
- 설치
- API
- spring
- Today
- Total
목록머신러닝/다슬봇 패치노트 (5)
맛동산
다음은 하루 동안의 8인 채팅방 대화 내용을 KoNLPy의 트위터, 한나눔, 꼬꼬마, 코모란의 pos분류한 결과임- 형용사,동사 추출 및 호감도를 나타낼 수 있는 용언 선택 (동사는 추출 자료가 많아 사진 생략, 호감도 용언은 주관적으로 선택) - 추출 자료 중 측정률 (호감도 용언 / 검색된 전체 용언)이 높은 것을 선택 ※ 전체 표본으로 성능을 조사하기엔 시간이 오래 걸리고 모든 사람의 말투(친구는 끼리끼리라고 나와 전혀 관련없는 집단의 실생활 대화)까지 반영하긴 자료가 부족하여 우선 트위터 분류기로 분석기 제작에 채택함 현재 분석기 진행상황은 아래와 같음 import codecs from konlpy.tag import Twitter # 형용사 : Ajective, 동사 : Verb from kon..
- R을 연동하여 유클리드언 유사도? 기법을 사용하여 문장의 연관관계를 측정. 유사 질문에 대한 답변 레코드를 출력해줌- 서블릿에서 select * 를 list에 담음, list의 getQue를 string으로 이어붙임, R을 수행할 class에 보내서 입력값(input)과 que_list 값들의 유사도 백터를 구함, 그것의 index를 리턴해서 list.get(index).getAns()를 리스폰스함 notice)저장 레코드가 무수히 많을 경우 Que를 리턴받고 다시 select ans from que={Que}를하면 select를 중복 수행해야하는 부담감이 있어서 select *후 index로 접근하게 하려고 했던건데이 경우 답변의 다양성을 만족시키지 못함 예)문 답안녕 -> 안녕하세요안녕 -> 반가..
- que(질문)의 공백, 특수문자를 제거한 que_trim 컬럼을 만들어서 안녕! 안녕!!!에 대해 같은 레코드를 매칭시도록 함- select 작업을 like %{que_trim}%로 하여 포함되는 질문에 대해 대응하도록 함 notice)like의 경우 ㅋㅋㅋ이 있을때 ㅋㅋㅋㅋㅋㅋ이 들어오면 대응하지못함.
- http://tastydarr.tistory.com/36 에 명시된 기능 완료- 입력된 질문에 일치하는 대답에 대하여 답변가능 notice)ㅋㅋㅋㅋ의 답변을 입력해도 ㅋㅋ에는 대응이 불가능함사용성이 떨어져서 데이터 수집 목적마저 달성하기 어려움
20일 - 디자인 완료(말풍선이 기억에 남음), 채팅부분 엔터, 데이터 입력부분 엔터 및 버튼 이벤트 리스너까지 21일 - 채팅부분 -> 채팅 입력시 ajax로 DB접근(서블릿, mybatis) 및 답변 없는 경우 '으우우웅?' 코멘트와 '여기 클릭(id)' 코멘트 append 하도록 만듬 해야할일 - 답변있을때 답변 보여주기, 질문은 했으나 답변 달지 않았을 때 처리, 질문 답변 입력 처리 22일 추가) 주소 기록을 위해 작성 css높이 바꿨음 답변을 입력하고 있습니다.. 추가함(값 처리가 오래걸릴 때를 위해) 질문 답변 입력 실패했을때, '여기'나오게 해서 다시 remember로 갈 수 있게 함. remember()함수에서 통신실패와 답변 없을때 껍데기를 만듬. 서블릿을 구현해야함(질문 답변 입력처리..