2024-07-08

07第61回CV勉強会＠関東「CVPR2024読み会」（前編）

勉強会コンピュータビジョン学会

本日第61回コンピュータビジョン勉強会＠関東「CVPR2024読み会」（前編）をLINEヤフー様の会場をお借りして開催いたしました。

以下、資料やリンク等をまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

YouTube

www.youtube.com

コンピュータビジョン勉強会＠関東

sites.google.com

資料まとめ

発表者	発表内容	資料
takmin	State Space Models for Event Cameras	https://speakerdeck.com/takmin/state-space-models-for-event-cameras-di-61hui-cvmian-qiang-hui-at-guan-dong-fa-biao-zi-liao
tereka114	Harnessing Large Language Models for Training-free Video Anomaly Detection	https://speakerdeck.com/tereka114/harnessing-large-language-models-for-training-free-video-anomaly-detection
onixwr	MLP Can Be A Good Transformer Learner	https://speakerdeck.com/safie/mlp-can-be-a-good-transformer-learner
alfredplpl	・Polos: Multimodal Metric Learning from Human Feedback for Image Captioning ・Streaming Dense Video Captioning ・Rich Human Feedback for Text-to-Image Generation ・Improved Baselines with Visual Instruction Tuning	https://www.docswell.com/s/alfredplpl/KLL7M9-2024-07-07-125154
sei_shinagawa	Iterated Learning Improves Compositionality in Large Vision-Language Models	https://www.docswell.com/s/sei_shinagawa/ZNREYL-iterated_learning
frkake	Correlation-aware Coarse-to-fine MLPs for Deformable Medical Image Registration	https://speakerdeck.com/frkake/corrmlp-correlation-aware-coarse-to-fine-mlps-for-deformable-medical-image-registration
ttyszk	BioCLIP: A Vision Foundation Model for the Tree of Life	https://speakerdeck.com/x_ttyszk/di-61hui-konpiyutabiziyonmian-qiang-hui-bioclip-a-vision-foundation-model-for-the-tree-of-life
Godel	・MemoNav: Working Memory Model for Visual Navigation ・SchurVINS: Schur Complement-Based Lightweight Visual Inertial Navigation System	https://speakerdeck.com/godel/navigation-and-slam-at-cvpr2024
ykamikawa	LayoutLLM: Layout Instruction Tuning with Large Language Models for Document Understanding	https://speakerdeck.com/ykamikawa/layoutllm-layout-instruction-turning-with-large-language-models-for-document-understanding

私の発表資料

"State Space Models for Event Cameras"を読みました

speakerdeck.com

2024-06-19

ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話

IoT 作ってみた告知勉強会

というタイトルで、﹁IoT縛りの勉強会! IoTLT vol.112﹂で弊社開発の﹁シナリオエンジン﹂について発表してきました。

speakerdeck.com 要は﹁ぼくがかんがえたさいきょうのIoT用プログラミング言語﹂です。このネタを発表するのは、AITRIOSミートアップに続いて二回目。ただ、この時は飛び込み発表だったり、時間も短かったりという感じだったので、ちゃんとした発表としては今回がはじめてです。はじめはビジネスとか関係なく、こういうコンセプトのソフトウェアが作りたい！という思いだけで作りました。これから頑張って普及させていきます。本当はIoT LTなのでArduinoと﹁妖怪ハンター候補生﹂を連動させて、謎を解いたら宝箱が開くようなデモを作ったのですが、当日シリアル通信部分が動かなくなり、泣く泣く画像認識だけを使った通常の﹁妖怪ハンター候補生﹂のデモとなりました。どこかでリベンジしたいです。

2024-06-17

PySerial経由でArduinoが動かずに苦戦した件

IoT Tips Python

最近Arduinoを触り始めていきなり躓いたのでメモ。以下のような、シリアル通信で数値を受け取ってその角度だけサーボモータを動かすArduinoのデモプログラムを書きました。環境はWindows11、Python3.12です。

#include <Servo.h>

Servo myservo;  // create servo object to control a servo

int pos = 0;    // variable to store the servo position

void setup() {
  Serial.begin(9600);
  myservo.attach(9);  // attaches the servo on pin 9 to the servo object
  myservo.write(pos);
}

void move_servo(int angle){
  if(angle < 0){
    for(int i = 0; i > angle && pos > 0; i -= 1){
      pos -= 1;
      myservo.write(pos);              // tell servo to go to position in variable 'pos'
      delay(15);                       // waits 15ms for the servo to reach the position
    }
  }
  else{
    for(int i=0; i < angle && pos < 180; i +=1){
      pos += 1;
      myservo.write(pos);              // tell servo to go to position in variable 'pos'
      delay(15);                       // waits 15ms for the servo to reach the position
    }
  }
}

void loop() {
  if(Serial.available()){
    int angle = Serial.parseInt();
    if(angle != 0){
      move_servo(angle);
    }
  }
}

Arduino IDEのからSerial Monitorから動かしたい角度を入力すると、その角度だけサーボが動くことは確認しました。今度は、PySeriralを用いてPython経由で90度サーボを動かすプログラムを書きました。

import serial
import time

ser = serial.Serial('COM3', 9600)
ser.write("90".encode())  # 角度(文字列)をArduinoに送信
time.sleep(1)  # 1秒待つ
ser.close()

尚、このプログラムを動かす前にArduino IDEを閉じないとエラーが出ます。ただし、このプログラムを走らせても、サーボは動かず、エラーも吐き出されません。どうもArduino側の受信準備に時間がかかるようです。そこで、

ser = serial.Serial('COM3', 9600)
time.sleep(2)  # 2秒待つ
ser.write("90".encode())  # 角度(文字列)をArduinoに送信
time.sleep(1)  # 1秒待つ
ser.close()

とシリアル通信前に2秒ほど待ち時間を設定したところうまくいきました。

2024-04-09

AR探索アドベンチャーのデモ動画

告知作ってみたコンピュータビジョン拡張現実感

弊社で開発したゲームプラットフォーム﹁AR探索アドベンチャー﹂のデモ動画を作成しました。商店街や観光地の集客/周遊、博物館や美術館などの教育コンテンツや、学校や企業の研修/オリエンテーションなどにご活用いただけます。

www.youtube.com (2024/04/13 追記) 某社から許可がもらえなかったため、動画を差し替えました。ご興味ある方はぜひこちらのページからお問い合わせください。

www.overlay-world.com 昨年、こちらのプラットフォームを使用して、綱島公園で﹁妖怪ハンター候補生﹂というコンテンツのテストプレイを行いました。デモ動画にはこちらのコンテンツを一部使ってます。

takmin.hatenablog.com

takminの書きっぱなし備忘録 @はてなブログ

主にコンピュータビジョンなど技術について、たまに自分自身のことや思いついたことなど