வாய்மையே வெல்லும் そういえば形態素解析機、そのまま辞書で意味が見られるようにすると便利だ வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月8日 .sozysozbot.@hsjoihs@jekto.vatimeliju ヒント:OTM-JSON、訳語が単離されていない .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月8日 送信しました வாய்மையே வெல்லும் 形態素解析の形態素分類を理語音声学の用語にしたいな வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju えーと緩衝音にはeulaって名前が付いてて、 .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました .sozysozbot.@hsjoihs@jekto.vatimeliju 単語はkraxaiunか? .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました வாய்மையே வெல்லும் ・形態素解析機に付加したいもの -表示をリパーシェに変更したり、しなかったりチェックボックス -分析した形態素の意味(訳語部分?)を表示する。 -共起表現をコーパスから取り出す வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju チェックボックス:即終わる 訳語部分:辞書から頑張って訳語を取り出す作業が必要 共起表現:語レベルの統計取れるほどコーパスがあるか不安だが、やってみる価値はある .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました வாய்மையே வெல்லும் 訳語部分とか単語部分とかOTMファイル(欲を言えばPDICが吐いたファイル)を自動で処理してくれるように出来たらいいのになあ வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 現状の理語辞書のデータ構造がこうなってしまってるのが問題&原因なんよね(「訳語」欄に語源と派生語も入ってしまっている) .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 .sozysozbot.@hsjoihs@jekto.vatimeliju 手作業で分離するのはめんどいから、なんかスクリプト書くしかないけど .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました 派生語は[語法]で区切られているから何とか分離できそう。 வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 語法欄には熟語も入ってるけど派生語は必ず【から始まっている。 வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju 「半角角かっこ+4桁の数字」を検出すれば語源もいけるなぁ .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました வாய்மையே வெல்லும் 語源と語訳は別に分けないでええやろと思ったりしたけど…… வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju そもそも、「私の持ってる辞書が古い」問題とかもある .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました வாய்மையே வெல்லும் PDICの吐いたファイルをアップロードする→OTMに変換して→形態素分解・意義表示器が使える形式に自動変換までしてくれるのがいいよね வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju 確か今のOTM-JSONファイルはZiphilさんのスクリプトによるものだったよね、ソースもらって改造するかな .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 11月9日 送信しました வாய்மையே வெல்லும் よさそう வாய்மையே வெல்லும்さんがに送信したこのメッセージを報告 வாய்மையே வெல்லும்さんがに送信したこのメッセージを削除 வாய்மையே வெல்லும் 11月9日 .sozysozbot.@hsjoihs@jekto.vatimeliju @sosoBOTpi @ziphil この「単純変換」のスクリプトとかってあります?(諸用途のため理語辞書用のチューニングをしたい) https://twitter.com/Ziphil/status/848770061472890880 … .sozysozbot.@hsjoihs@jekto.vatimelijuさんがに送信したこのメッセージを削除 .sozysozbot.@hsjoihs@jekto.vatimeliju とりあえず反応を待とう