言葉を「エンジニアリング」するソリューションカンパニー。制限言語、語彙統制、用語管理、翻訳支援システム、執筆支援システム、機械翻訳の導入を支援。
×
固定報酬制
|
108,000円
|
---|---|
納品完了日
|
2017年11月30日 |
掲載日
|
2017年11月15日 |
応募期限
|
2017年11月16日 |
応募した人 | 9 人 |
---|---|
契約した人 | 0 人 |
募集人数 | 1 人 |
気になる!リスト | 17 人 |
日本語文章の中に入り込んでいる「顔文字」を検知し、抽出したいと考えており、ご協力いただけるエンジニアの方を募集いたします。 お仕事の詳細: ▽システム開発依頼の目的・概要 霧島山(新燃岳)開山記念プランのご案内(*^_^*) 是非この機会に当宿自慢のお料理をご堪能下さいませ(^ω^) ご好評につき新幹線全線開通記念プランです(*^_^*) など、日本語文中に「顔文字」が入り込むことが、特定のコンテンツではよくあります。 この例の場合は、行末にありますが、文中に出現する場合もあります。 顔文字は多様なものがあり、これらのものを単純に抽出することが難しいのですが、何らかの形で、100%の精度では難しいかもしれませんが、できる限り高い精度で検出、抽出することができればと考えています。 なお、抽出対象のデータは約 800MB あります(顔文字が入っていない文章がほとんどですが、顔文字が入っている行だけを事前抽出することもできず、この規模のデータが処理対象となります)。 ▽システム開発に利用するプログラミング言語 ・使用言語:Python 3.6 ▽重要視する点・経験 自然言語処理を含む大規模テキストデータの処理の経験がある方。 ▽注意点・禁止事項 ※開発したシステムに関する情報を第三者に漏洩すること ▽その他コメント ※実際のシステム開発の進め方・別途詳細は、クラウドワークスのメッセージでやりとりして決められればと思います。 ※このお仕事以降も、継続的に追加で開発依頼をさせていただくことも可能です。 たくさんのシステムエンジニアの方からのご連絡・ご応募お待ちしております。 予算は目安として入れておりますが、ご相談に応じます。 |
特記事項 |
---|
|