Excelのセルに記載された「ひらがな」を漢字に変換するプログラムのお仕事 « エンジニア・デザイナーのクラウドソーシング

× このお仕事の募集は終了しています。

×

Excelのセルに記載された「ひらがな」を漢字に変換するプログラム

業務システム・ソフトウェアの仕事の依頼

仕事の概要

掲載日 2013年09月24日
応募期限 2013年10月08日
仕事の種類 システム開発 » Web開発・システム設計 » 業務システム・ソフトウェア
支払い方式 固定報酬制 予算 10,000円 〜 50,000円
※マイルストーン払い対応します
『マイルストーン払い』とは、固定報酬制案件において作業工程ごとに予算を決め、分割で報酬が受け取れる機能です
納品希望日 -

仕事の詳細

漢字変換の研究をするためのツールを開発したいと考えており、開発者の方々を募集させていただきます。

お仕事の詳細:
▽ツール開発依頼の目的・概要

(必須要件)
Excelのセル(例としてA列)にひらがなが記載されています。また、B列には1以上の整数が記載されています。
A列に記載されているひらがなを、B列に記載されている数字の回数だけ変換し、その結果をC列に記入するツールを求めています。
VBAでExcel内で完結するものでも構いませんし、CSV形式でImport/Exportする外部プログラムでも構いません。

(あると望ましい機能要件)
(1)漢字変換を行った際に、その文字列(ひらがな)が、一つの文節として認識されて変換されたものか、そうでなかったものかを、D列に出力できると理想的です。わかりづらいかもしれませんが、漢字変換をする際に表示されるアンダーラインが1つなのか、2つ以上にわかれるかどうか、です。
(2)漢字変換された結果が、どの品詞(名詞、助動詞、助詞…)に認識された結果変換されたものかわかると理想的です。MS-IME/ATOK等の形態素解析のプロセスにタッチする必要があるのではないかと考えており、相当困難だとは思いますが、可能であればということで起債致します。

尚、いずれの要件もMS-IMEやATOKといった日本語入力システムの種類やバージョンに制限がある場合、それをお伝えください。

▽ツール開発に利用するプログラミング言語
Excel内で完結するのであればVBAで構いませんし、
外部プログラムとする場合には、特に言語は不問です。

▽重要視する点・経験
あると望ましい機能要件を満たすことができる方を優先致します。
記載した方法以外にも実現可能なアイデアがあればぜひご教示ください。
また、望ましい機能が実現できる場合とそうでない場合で金額は変動します。

▽注意点・禁止事項
※開発したツールに関する情報を第三者に漏洩すること

▽その他コメント
※実際のシステム開発の進め方・別途詳細は、クラウドワークスのメッセージでやりとりして決めさせて頂ければと思います。
※このお仕事以降も、継続的に追加で開発依頼をさせていただくことも可能です。

ご連絡・ご応募お待ちしております。

2013年09月24日 18:53追記

変換のもとになる「ひらがな」のリストは、文章ではなく単語レベルのものです。ですので、1文字~5文字程度のひらがなです。

但し、今後ひらがなの範囲を「単語+助詞」に拡張することを考えており、その場合には最大10文字程度まで増える可能性はあります。

このように、ひらがなが複数の品詞tで構成されるような場合には、「望ましい機能要件」に記載した品詞特定機能などは実装が困難かと思いますので、そうしたケースでは単純に漢字変換を自動化できれば十分です。

宜しくお願い申し上げます。

2013年09月26日 15:57追記

色々とご質問を頂いておりますので、要件について補足致します。

■環境について
Excel上での動作を前提に考えておりましたが、利用環境によってエラーが発生したり、
バージョンアップごとに改修が必要となるなど、デメリットも気になってまいりました。
殆どの方が別プログラムによるご提案であることも受け、今回はExcelとは別プログラムという仕様にしたいと思います。

■必須要件の仕様について
ひらがなの一覧と、変換回数はCSVフォーマットでプログラムに渡されることを前提としてください。
プログラムはそのCSVの内容に基づいて、必須要件としては以下を行うものを想定しております。
 - PCにインストールされている標準のIMEを用いて
 - Inputされたひらがなを、Inputされた変換回数分だけ変換し
 - 結果を別のCSVに出力

ここでいうIMEは、MS-IME・ATOK等、PCに導入されていて標準(デフォルト)に設定されているものです。
「MS-IMEでしか動かない」というものではなく、ATOKやGoogle IMEでも使えるものを希望致します。

■あればより望ましい要件の「形態素解析」について
形態素解析について何名かの方からご質問を頂きましたが、今回取得したいのはIMEが実際に用いた形態素解析です。
現在は、変換後の文字列をmecabに取り込んで分析をしておりますが、これではIMEとは差が生じます。
(IMEによってコスト分析のロジックが異なる為)
この為、MS-IME・ATOK・GoogleIME等が実際にどう形態素解析を行い、品詞を認識できたかわかれば理想的です。

難しい場合には、今の手動作業を自動化するという意味で、変換結果をmecab等の形態素分析ツールに入力し、
(実際のIMの認識とは異なるものの)参考情報として品詞情報を取得したい思っております。
一応手動でもできるため、今回のツールに取り込むかどうかはコストによって判断させて下さい。

尚、辞書は以下より選択できる機能があればと思います。手動でファイル置き換え、といったやり方でも構いません。
いずれも無料で配布されており、且つフォーマットに互換性があります。
- UniDic
- NAIST-jdic
- IPA-dic
- JUMAN

どうぞ宜しくお願い申し上げます。

このお仕事に関連するスキル:
MS-Excel (エクセル)

会員登録(無料)

他の仕事:Web開発・システム設計の仕事を探す

β版ご意見箱

× 今後表示しない