「みんなのお仕事相談所」では、ユーザーさまのご依頼の相場や製作期間、
契約書やお金に関する悩みを気軽に相談できるQ&Aコミュニティです。
違反案件についてはよくある質問の「【共通】違反のお仕事とは」をご覧ください。
また、違反報告についてはよくある質問の「【共通】違反報告とは」をご確認ください。
はじめまして。
システム開発の全くの素人です。
特許庁のデータを利用して、顧客に新たなサービスを提供したいと考えております。
特許庁の特許電子図書館の中に、ある特許出願の審査状況を確認できる「審査書類情報照会 」というページがあります(土日は、稼働していない時間があります)。
http://www.ipdl.inpit.go.jp/Tokujitu/pfwj.ipdl?N0000=118
競合他社の特許出願がどのような状況になっているのか確認する場合は、こちらを見ればある程度確認できます。
現在、私が検討しているのは、顧客の依頼のあった特許出願について、定期的にアクセスして、審査状況を確認して、変動があったら(変動がなくても)、顧客に自動的にメールでお知らせするようなシステムです。
顧客には、当方で作成するHPにアクセスしてもらい、e-mailアドレスと特許出願番号を入力してもらえれば、その後、定期的に状況を知らせるe-mailが届くという感じにしたいです。
とくに急ぐわけでもありませんので、通常の作業スピードでかまいません。
開発に必要な費用はざっくりとどのくらいでしょうか?
よろしくお願い致します。
こんにちは。
APIなどが公開されているのでしたら、
定期的にアクセスして審査状況を読み取るのは自動で可能ですが、
APIなどが公開されていない場合は、
目視確認による手動操作、もしくは、検索結果のスクレイピング(非推奨)
を使うことになると思います。
APIが存在する場合は、開発費用40万円くらいかと思います。
APIが存在しない場合は、開発費用60万円くらいかと思います。
ご参考ください。
おそらく、APIはないと思われますので、スクレイピングやクローリングが必要かと思われます。
先方が常時稼働しているシステムではないようですので、作成はやや困難かと思います。
管理画面などにどの程度の機能を盛り込むかによっても変わりますが、プログラムの作成とセットアップに40-50万程度はかかるかと思われます。
また、別途サーバー代(1000円/月~のVPS)が最低限必要です。(クライアント数、登録数によって要求スペックは変わります)
お世話になります。
一番最初の方が非推奨と仰っているように、スクレイピングで情報を取得するのは規約違反になる可能性があります。
2.大量アクセス・ロボットアクセス等に対する制限
特許電子図書館は工業所有権情報に関して公共的に利用されるものです。したがって、一般の利用を妨げる可能性がある、データの単純な収集を目的とした大量データのダウンロードや、ロボットアクセス(プログラムによる定期的な自動データ収集)のような行為は禁止させて頂いております。上記のような行為と見做されるような行為が発見された場合は、予告なしに特許電子図書館へのアクセスを制限させていただきますので、あらかじめご了承下さい。
http://www.ipdl.inpit.go.jp/notice.htm
大量にデータを抜き取るような行為でなければお目こぼしされる可能性はありますが、安定的にスクレイピングする場合にはIPを変えたり、refererをランダムに変えたり、不定期にアクセスするようにしたりする必要があります。
以上ご参考まで。
顧客の依頼のあった特許出願に関してだけのクローリングであれば、「大量アクセス」には当たらないと思うのですが、
一般の利用を妨げる可能性がある、データの単純な収集を目的とした大量データのダウンロードや、ロボットアクセス(プログラムによる定期的な自動データ収集)のような行為は禁止させて頂いております。
上記の規約が微妙な書き方で、ロボットアクセス自体を禁止しているようにも読めますね。特許庁に問い合わせるのが確実でしょうか。