「クロール」を含む日記 RSS

はてなキーワード: クロールとは

2024-07-13

anond:20240713140530

楽しく運動する範囲だと大してカロリー消費しなくない……?3キロぐらいクロールでもしてるの?

2024-07-07

anond:20240707222534

俺はクロールをして50メートルおよいだら

教師「犬かきにしかみえなかった。後半は溺れているようにしかみえなかった。」

って言われて50メートル泳ぎ切ったことなかったことにされた

スイミングスクールに通ってる奴らだけが評価された

そこから俺は教師が嫌いになった

2024-06-30

クロールの息継ぎって右だっけ?左だっけ?

あれ???

2024-06-28

anond:20240628220617

90%の人間自分の頭で考えてない

ネットクロールして集めたデータAI学習するのと全く同じ

たくさん見た情報学習してそれを繰り返してるだけ

はてな政治バカな気狂いどもを見ればわかるだろ?

似たり寄ったりのバカが群れをなしてお互いを褒めあっている

そうやって脳みそ空っぽの生体botが量産されていく

2024-06-26

最後のチャンス】猿でも反AIでもわかる「COPAINTER 対策」の不毛


 COPAINTERAIAICOPAINTER
 B29AI
 
i2i
COPAINTER
 

AI

 AI
 
 AI
 使
 


使



 
 
 AI使
 AI使i2i使使
 i2i
 
 COPAINTER
 

COPAINTER

 COPAINTERAI
 i2i
 
 COPAINTER
 i2i
 
 i2i
 i2iAI
 
 AI AI
 
 
 
 
 
 
 
 
 
 COPAINTERCOPAINTER使
 
 AI
Permalink | (3) | 08:15 
このエントリーをはてなブックマークに追加

2024-06-22

クロールで50メートルを50秒→10休み×5セットで5分くらいが限界ギリギリな感じだし測りやすいしちょうどいいな

2024-06-11

anond:20240611145850

pyppeteerでクロール専用に特化したコンテナ運用することのどこがおかしいんだ?

お前、実運用クローラいたことある

anond:20240611142102

相手サイトは「このURLクロールしてください、UAにこの文字を含ませてください」とは言うが、サイトxmlとかのプレーンになってることまでは保証してないってだけだが

anond:20240611135840


IO

Permalink | (4) | 14:00 
このエントリーをはてなブックマークに追加

anond:20240611135352

クロールってのは標準のフォーマットがあって、WARCファイルというのがある

このWARCファイルを一旦保存しておいて、毎日S3にアップロードしてる

S3を操作するコンテナが別途あって、アップロードされてきたWARCファイルDBに読み込む操作がある

anond:20240611134832

ブラウザを使ってクロールしてるんだよ

headlessモードって知ってる?pyppeteerを基本は使ってる

といっても、相手サイトは予めこちらのクロール許可しているので、UA特定文字列を送って承認してもらってるが

anond:20240611120041



phppython

phplaravel, pythonpytorchsklearn使

AWS



 Elasticsearch
 (cron)
4
Google


(
Permalink | (4) | 12:08 
このエントリーをはてなブックマークに追加

2024-06-09

SearchConsole で自動生成されたようなクエリパラメーター付きのURLが大量にリストにある

有効なページはそこまで多くないのに、それらのせいでページ数が数万とかになってる

もちろん robots.txt や noindex や canonical はついてるからインデックスはされてないんだけど、SearchConsoleの管理画面に一覧に URL として並んでる

こういうのがあるから有効なページがクロールされるのが遅かったりするのかと思う

実際のページが 500 でも数万件あるとみなされてればクローラーは数万件を処理するわけだし

インデックス登録されないとサイト検索が使えず不便

2024-06-05

anond:20240605082626

インターネットアーカイブクロール型なので、お前の意思で保存はできないって話をしているんだが

日本語しかたか

ちなみにインターネットアーカイブ関係者なんだよなーw

馬鹿馬鹿にされるのおもしろいなーw

2024-05-18

anond:20240518063049

なんて怠惰

インターネットを隅々まで自動クロールするのが永続してると思ってたのに

2024-04-26

「このゲームオススメだよ! 推定プレイ時間:100時間」←タイパわっる!



2

30
510
1









10





20



Permalink | (6) | 19:57 
このエントリーをはてなブックマークに追加

2024-04-04

はてなー画像生成AIを誤解しているようだけど


AIAI


 
 
AI

AIAIAI
 
 

Pixiv使AI
 
 
使使
SNS AI使

 
 
AI使AI


 
 
WinnyAIWinny

 
 

AI
AI
UQ HOLDER!
AI

Permalink | (2) | 21:23 
このエントリーをはてなブックマークに追加

2024-04-01

anond:20240401155117

パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ

で、じゃあデータはどうしているのかというと、クロールしてる

あるコンテンツ検索エンジンを作っているのだけど、基本的にはデータクロールで確保

機械学習教師データは?というのは、distant supervisionでラベルづけしてるよ

2024-03-02

[]ラチェット&クランク パラレルトラブル PS5

とりあえずクリア

難易度は一番低いやつ

プレイ時間わからんが多分15時間くらいか

途中詰まりそうになったときもあったけどなんとかクリアできてよかった

ps2の1はラストステージで詰まってクリアできんかったからなー

ロックマンのワイリーみたいな立ち位置なんだなラチェクララスボスって

リベットがかわいかったなー

声もあってた

逆にラチェット眉毛ぶっといしもさくてきもかった

画面のきれいさとロードのなさはすぐ慣れて、後半は逆につまんなかったなー

クランクメインのパズルステージもつまんなかった

最初の1時間くらいの楽しさだけで十分だったかなー

まちとかステージオブジェクトもやたらリアルで数おおいけど、逆にそのせいでどれが壊せるものかとか、

大事な隠しアイテムかとかがすげーわかりにくくなっててイライラした

最後最後アクセシビリティってオプション設定あることしって、インタラクトできる箱とかゴールデンボルトとかギミックとかの色を変えたらすげープレイやすくなったわ

最初からしとけばよかった

距離レンチなぐりはなぐってる感あるからいいけど、

わりとメインのはずの遠距離武器の爽快感いまいちだったのは微妙だったなあ・・

イージーでも敵硬すぎたから余計にそういう感じした

距離攻撃とどかねえから遠距離必須みたいな敵やボスが多いから余計に感じた

ベルトスクロールみたいにエリア内の敵倒さないと次に進めないのが結構あるけど、

終わってるかどうかがすげーわかりにくくて、終わってないのに進もうとして死ぬってのも何回かあってうざかったなー

まあ1回やればいいかなって感じ

スターオーシャン6とかもこういう感じで交互に見せてくれればよかったのになと

ラチェットリベットで2週させられてたらクソうざかったと思うわ

こんな感じで1周で両方みせてくれたらいいんだよ

絵師さんは何もおかしなことを言っていない




   
1. 304
2. AI使 
 
 

304

AI304 AI
   

  


 

30430AIAIAI

 
AI
 
  

AI使

Pixiv AI    : Mid journey stable diffusion etc...
 
AIAI    LoRA
 
AI   CLIP
 

 
 

AI

 
CLIP
OpenAI使
  

使CLIP
https://github.com/OpenAI/CLIP]
CLIP
   
  

Pixiv AI


AICLIPstable diffusion使
   
1. 
2. 
3. 
 
  CLIP
 
使
使使
PixivAIp7"robot.txt"AI使Pixiv
  
  

AI 

LoRA

使
 

 
304


  
AI
(p6. 

  
:

 



AI
  
AIAI304


https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
 


 

Permalink | (0) | 17:57 
このエントリーをはてなブックマークに追加

2024-02-12

anond:20240211181217

軽微利用のくだり、その解釈だと検索エンジン普通に違法にならね?

検索エンジン側で持ってるデータベースクロールしたデータを全文ぶち込んでインデックス作ってないとこんな検索速度出せないでしょ

まさか検索するたびにクローリング走らせて全文中に検索ワードとの合致あるか調べて結果返すわけでもあるまいし

https://public-comment.e-gov.go.jp/servlet/PcmFileDownload?seqNo=0000267588

パブコメ用に素案も読み返してたんだけど、検索拡張生成(RAG)についての文化庁見解新聞協会のそれとはそもそも大幅な食い違いがありそう

https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf

というか問29に沿って考えれば、「情報解析によって時事情報(※ただの事実であって著作権によって保護されない)を表示する」が主であって、その過程における「既存著作物を複製翻案等する」は従であるとも評価しうるのでは

2024-02-08

個別ページじゃなくてトップレベルドメインから全部クロールして魚拓取れるサービスってないかな?

記事数が1000以上あって手作業ダルいんじゃが

2024-01-16

ワイがなぜか図書館が好きになれない理由3つ



1
2
3
49
5
6
46


 
📚📚📚  📚📚📚
(Д)

Permalink | (34) | 11:06 
このエントリーをはてなブックマークに追加
ログイン ユーザー登録
ようこそ ゲスト さん