Web関連のビジネスを運営しています。
×
固定報酬制
|
5,000円 〜 10,000円
|
---|---|
納品完了日
|
2022年12月30日 |
掲載日
|
2022年12月26日 |
応募期限
|
2022年12月27日 |
必要なスキル
|
応募した人 | 11 人 |
---|---|
契約した人 | 1 人 |
募集人数 | 1 人 |
気になる!リスト | 6 人 |
※年内納品可能な方を優先します。水曜日までに出来ると助かります。 指定されたページをスクレイピングして、データを取得し、csvに書き出すスクリプトを作ってください。 スクレイピングのプログラムは2つです(シンプルな構成にするために2つに分けてください。) 繋げるとタイムアウトの問題など面倒が増えそうなので分ける意図であり、複雑なものではありません。 実行は、ローカルのMac (※M1ではありません)上で行います。 ログインなしの状態でデータ取得できる範囲での取得です。 # 処理概要 PGM①/get_list_data 1.id番号の範囲を指定して、ループ処理 ※https://xxxx.com/xxxx?xxxx&page={id}&xxxxx のようになっているので、id部分を入れて回す 2.検索結果に表示される画像以外のテキストデータ、リンク先などを取得する 3.csvへ出力 PGM②/get_detail_data 1.①で書き出したcsvを読み込む 2.詳細ページに遷移し、必要な情報を取得する 3.csvへ出力 途中で止まってしまう場合は、どこのidまで処理したかわかるようにすること(ログとして出すなど) その後、その後のidから続けて処理しても、データがその後から追加されるようにしてください。 ### 納品物 - Pythonファイル一式 - requirements.txt - Readme.md ### 予算 5,000円〜10,000円を想定(税別・弊社支払い金額です) |
特記事項 |
---|
|
クラウドワーカー | 応募日時 |
---|---|
ksagawa | 2022/12/26 20:42 |
Yamaa3 | 2022/12/26 18:55 |
riku2264 | 2022/12/26 18:10 |
yoshiayu19771106 | 2022/12/26 17:27 |
(退会済み) | 2022/12/26 17:23 |
yosshit47 | 2022/12/26 16:41 |
EighTree | 2022/12/26 16:36 |
topstar_cw | 2022/12/26 15:57 |
あき@スクレイピング | 2022/12/26 15:47 |
odrag0n | 2022/12/26 15:42 |
kawana.pg | 2022/12/26 15:38 |