基本的にはWEBエンジニアとして働いています。
×
固定報酬制
|
16,200円
|
---|---|
納品完了日
|
2015年05月28日 |
掲載日
|
2015年05月22日 |
応募期限
|
2015年05月27日 |
応募した人 | 1 人 |
---|---|
契約した人 | 0 人 |
募集人数 | |
気になる!リスト | 3 人 |
裁判所の判決文の収集(PDF形式)を行い、ファイルとして保存した上で、さらにテキストファイルにするプログラムの作成を依頼いたします。 お仕事詳細: 0. 下記1-2の機能を持つプログラム(rubyまたはPython3)の作成 1. 判例のデータを収集するプログラム(クローラ) - 【参考】裁判所の判例検索:http://www.courts.go.jp/app/hanrei_jp/search1 - PDFファイルをローカルに保存する - 要旨データも保存する(詳細は個別に) 2. PDF内の文章をテキストにしてファイルとして保存するプログラム。 - テキストの埋め込みがうまくいっていないPDFに関しては、クレンジングしてからテキストファイルに格納する。 ▽データクリーニングで求められるスキル - 基本的なクローラの作成スキル(Ruby or Python3) - PDFファイルからテキストを抜き出す技術 - 基本的なテキスト処理スキル ▽データの納期 - 5 / 29 ▽データの納品形式 Ruby または Python3プログラム一式 動作させて取得したファイル(動作のサンプル的なファイル群) ▽注意点・禁止事項 ※データの内容を第三者に漏洩することは厳禁です。 十分な遅延を持たせるなど、適切な手段を実装したクローラとしてください。 ▽その他コメント 仕事内容についてご質問等ありましたら、お気軽にご連絡ください。 |
クラウドワーカー | 応募日時 |
---|---|
hisa_04 | 2015/05/23 18:21 |