文字起こしの人気記事 109件 - はてなブックマーク

1 - 40 件 / 109件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

文字起こしの検索結果1 - 40 件 / 109件

文字起こしに関するエントリは109件あります。 AI、人工知能、音声認識などが関連タグです。人気エントリには﹃Microsoft、文字起こしアプリ﹁Group Transcrib‪e‬﹂を公開 - iPhone Mania﹄などがあります。

Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania
- 1241 users
- iphone-mania.jp
- テクノロジー
- 2021/03/16
Microsoft、文字起こしアプリ﹁Group Transcrib‪e‬﹂を公開 2021 3/16 Microsoftは3月上旬、対面での会議や会話のためのリアルタイムのテープ起こしと翻訳を提供する﹁Group Transcrib‪e‬︵グループ転写︶﹂のiOSアプリをリリースしました。会議の参加者がそれぞれのデバイスで使用することができます。メモを取らずに会議に集中できる優れもの最先端のAI音声・言語技術を搭載したGroup Transcribeで、会話の参加者は共有セッションを開始し、それぞれが携帯電話のマイクを使用して、リアルタイムで誰が何を言ったかを示す、非常に正確なトランスクリプトをキャプチャできます。会話の高品質な記録に自信を持つことで、ユーザーはメモを取る必要がなくなり、会話そのものに注意を集中させることができます。トランスクリプトは、共有したり、再配置も簡単に行う
- microsoft
- アプリ
- あとで読む
- 文字起こし
- iphone
- ツール
- 仕事
- 日本語
- 音声認識
- app
【全文】「勝ちっ放しはないでしょう、安倍さん」野田元首相から安倍元首相への追悼演説｜日テレNEWS NNN
- 1205 users
- news.ntv.co.jp
- 世の中
- 2022/10/25
2022年10月25日、衆議院本会議。選挙演説中に銃撃され死去した安倍元首相に向けた追悼演説が行われた。演説に臨んだのは、立憲民主党の野田元首相。かつて野党時代の自民党総裁だった安倍氏と、首相だった野田氏は、党首討論の場で、衆議院の解散をめぐる“真剣勝負”に臨んだ間柄だ。追悼演説の中で野田氏は「再びこの議場で、あなたと真剣勝負を戦いたかった」「勝ちっ放しはないでしょう、安倍さん」と天上の故人に語りかけた。演説の全文は以下の通り。本院議員、安倍晋三元内閣総理大臣は、去る7月8日、参院選候補者の応援に訪れた奈良県内で、演説中に背後から銃撃されました。搬送先の病院で全力の救命措置が施され、日本中の回復を願う痛切な祈りもむなしく、あなたは不帰の客となられました。享年67歳。あまりにも突然の悲劇でした。政治家としてやり残した仕事。次の世代へと伝えたかった想い。そして、いつか引退後に昭恵夫人と共に
- 言葉
- 政治
- あとで読む
- 人生
- 野田佳彦
- 安倍晋三
- 訃報
- 追悼
- 国会
- politics
「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化
- 953 users
- www.buzzfeed.com
- テクノロジー
- 2019/09/02
Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化2月にβ版がリリースされたGoogle製の音声文字変換（Live Transcribe）アプリ。もともと聴覚障害者のために作られたアクセシビリティ機能だが、精度の高さから文字起こしとしても使えるのではないかと話題だ。来日中のプロダクトマネージャー、ブライアン・ケムラー氏に話を聞いた。
「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記（97）【急遽テレワーク導入！の顛末記】
- 779 users
- internet.watch.impress.co.jp
- テクノロジー
- 2022/05/02
- 音声認識
- あとで読む
- iphone
- 文字起こし
- ツール
- PC
- youtube
- 企業
- tips
- 便利

iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
- 609 users
- ascii.jp
- テクノロジー
- 2022/05/21
アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日本語対応の自動文字起こしアプリコミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records（シャムロック・レコード）の代表兼エンジニアである青木秀仁氏が開発を手がけている。モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/
KAJI | 梶谷健人 on Twitter: "GlaspっていうChrome拡張機能使うと、YouTube動画からボタン一発でChatGPTにサマリー文章を作ってもらえてとても便利。 DeepLと組み合わせて海外のカンファレンス動画やレクチャー動画も高速で学習できる。 https://t.co/FHSapesC0K"
- 538 users
- twitter.com/kajikent
- テクノロジー
- 2023/01/20
- chrome
- あとで読む
- ChatGPT
- 学習
- AI
- youtube
- 文章
- 動画
- extension
- 便利
文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
- 520 users
- gigazine.net
- テクノロジー
- 2023/03/09
会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。すると、GitHubアカウントでのサインインを求められます
- AI
- 文字起こし
- あとで読む
- webサービス
- Whisper
- アプリ
- 音声
- 文章
- 人工知能
- OpenAI
1991年の山下達郎インタビューに見る根深い孤立感と不信感 - YAMDAS現更新履歴
- 470 users
- yamdas.hatenablog.com
- エンタメ
- 2023/06/02
少し前に、以下のツイートを目にした。 For You がリリースされた頃、山下達郎は今のようにリスペクトされる存在ではなく、一般リスナーにとっては「流行り物」で、頭でっかちの音楽好きにとっては「チャラチャラした音楽」と捉えられていたことは、ポップミュージックの受容の歴史としてきちんと記録に残しておいた方がいいと思う。— Andy＠音楽観察者 (@andymusicwatch) May 14, 2023 当時のミュージックマガジンのレビューでの評価が典型的ですよね。 https://t.co/Rvj2l5r2pE— Andy＠音楽観察者 (@andymusicwatch) May 14, 2023 このあたりについて参考になる山下達郎のインタビューを参照してみたいと思う。というわけで、1989年から2004年まで読者だった rockin' on のバックナンバーを引っ張り出す「ロック問はず
- 山下達郎
- 音楽
- インタビュー
- あとで読む
- music
- ロック
- interview
- 雑誌
- 人生
Gakushi Fujiwara / 藤原学思 on Twitter: "ウクライナ危機、安保理10回目の会合が始まります。ロシアの要請です。このスレッドで速報していきます。フランス大使の言葉が、会合の異質さを物語ります。﹁ロシアがまた偽情報、情報操作、フェイクニュースを戦略として使っている。会… https://t.co/1LAaq577Xc"

● 442 users

● twitter.com/fujiwara_g1

● 政治と経済

●2022/03/12
ウクライナ危機、安保理10回目の会合が始まります。ロシアの要請です。このスレッドで速報していきます。フランス大使の言葉が、会合の異質さを物語ります。﹁ロシアがまた偽情報、情報操作、フェイクニュースを戦略として使っている。会… https://t.co/1LAaq577Xc
- 戦争
- ロシア
- 国際
- あとで読む
- twitter
- 政治
- ウクライナ
- UN
- war
- デマ
文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
- 396 users
- blog.takuya-andou.com
- テクノロジー
- 2022/10/02
どうもこんにちは、あんどう（@t_andou）です。前回宣言した通りに誰でも簡単にYoutubeの字幕ファイルを作る方法を書きます。「Youtubeの」と書いていますが、実際はどの動画でも対応してます。前回の記事 blog.takuya-andou.com まずはGoogleColabの共有 colab.research.google.com 使い方 GoogleColabに記載していますが 1.GPUを使用するように切り替え上の「ランタイム」→「ランタイムのタイプを変更」からからGPUを選択 2.右上の接続下のセルを実行すると自動的に接続されるので省略可能です 3.動画をアップロードここにドラッグ＆ドロップでアップできます大容量のデータの場合、GoogleDriveと連携した方が効率的です 4.入出力のパスの変更ファイル名に合わせて変更してください 5.全セルを実行あと
- AI
- あとで読む
- youtube
- 文字起こし
- 動画
- ツール
- 言葉
- GPU
- google
- 無料
「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記（173）【急遽テレワーク導入！の顛末記】
- 392 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/01/29
- AI
- あとで読む
- 文字起こし
- ツール
- tool
- webサービス
- データ
- 無料
- 音声認識
- 仕事
生成AIで議事録が60分→2分。96%工数削減した自動生成ツールの紹介｜noteエンジニアチームの技術記事
- 384 users
- engineerteam.note.jp
- テクノロジー
- 2024/06/17
こんにちは、note AI creative（以下、nAc）の田中です。 nAcとして今までさまざまな社内の業務改善に取り組んできましたが、中でも「議事録作成業務」は負担の大きい業務の１つでした。セールス・カスタマーサクセスなど顧客と対面する部署では特に議事録作成は重要な業務として頻繁に発生しますが、1回あたり最大60分かかっており改善の余地がありました。 nAcが作成した生成AIのソリューションを使うことで、作業量が96%も削減され、60分の作業が2分で終わるようになりました。議事録を生成するデモgifnote proチームの社内発表資料から抜粋この記事では、議事録作成を自動化するために作成したソリューションとその効果について紹介します。議事録作成効率化の歴史議事録作成業務の効率化を目指し、まずは「tl;dv」というツールを導入してテストを行いました。 tl;dvは非常に機能が豊富
- AI
- あとで読む
- ChatGPT
- ツール
- 人工知能
- エンジニア
- GPT
- 便利
- 技術
- 機械学習
全国霊感商法対策弁護士連絡会記者会見　文字起こし① : 統一教会（世界平和統一家庭連合）って何？合同結婚式や安倍元総理との関係についても
- 365 users
- anti-mooniescult.blog.jp
- 暮らし
- 2022/07/14
①は全国霊感商法対策弁護士連絡会の声明とコメント ②はAさんのコメント及びAさんに対する質疑応答 ③は弁護士に対する質疑応答黙祷部分は省略敬称略恐らく誤字脱字誤変換あり「あの」「えー」などは省略司会進行、事務的な会話等は省略した部分もあり聞き取れなかった部分は○○○で表記発言者が不明の場合は???で表記川井「最初に私の方から、本日の会見の趣旨が記載されている声明文の方読み上げさせていただきたいと思います。声明1、山上被疑者が安倍晋三元首相を死に至らしめた今般の卑劣極まりない行為は、いかなる理由があろうとも決して許されないことです。当会は安倍元首相のご冥福を心からお祈り申し上げます。 2、山上被疑者の母親が統一教会に多額の献金をし、仮定を崩壊させたことへの恨みが、今回の事件の動機であるという報道が事実であるとすればですが、同被疑者母親の常軌を逸した統一教会への献金をはじめと
- 宗教
- あとで読む
- 政治
- 統一教会
- 事件
- カルト
- 社会
- religion
- 自民党
iPhone・Androidで高速に日本語音声入力するためのベストプラクティス
- 357 users
- stocker.jp
- テクノロジー
- 2021/12/13
先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。 PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。 iPhone・iPadの場合先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。仕事
OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
- 333 users
- gigazine.net
- テクノロジー
- 2022/09/22
画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが示されています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネット上から収集された合計68万時間におよぶ音声データでトレーニングされた文字起こしAIです。OpenAIのブログ記事には「早口のセールストーク」「K-POPの曲」「フランス語」「独特なアクセン
「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入！の顛末記】
- 315 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/04/01
- 文字起こし
- あとで読む
- iphone
- PC
- zoom
- 仕事
録音の文字起こし超ラクで仕事のやり方に変化。私生活はひたすら運動した【私の2023】 - 家電 Watch
- 301 users
- kaden.watch.impress.co.jp
- テクノロジー
- 2023/12/30
- ガジェット
- あとで読む
- 文字起こし
- 仕事
- 家電
- 生活
- life
自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
- 286 users
- gigazine.net
- テクノロジー
- 2022/11/17
AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステムを試した結果について報告しています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダム氏が全自動口述日記を思いついたのは、以前から「1TB超えのストレージを内蔵したスマートフォンが登場すれば、24時間365日録音し続けることが可能なのではないか」と考えていたことから
- AI
- あとで読む
- 生活
- 文字起こし
- エンジニア
- Lifelog
- google
- 機械学習
ダイヤモンド・プリンセスはCOVID-19製造機なぜ船に入って一日で追い出されたのか（岩田健太郎先生の動画から文字起こし）｜チョコレートサイダー通信
- 281 users
- note.com/chocolat_psyder
- 世の中
- 2020/02/19
▼2020年2月18日に公開された神戸大学教授の岩田健太郎先生（Twitter）による「ダイヤモンド・プリンセスはCOVID-19製造機なぜ船に入って一日で追い出されたのか」と題した動画についての文字起こしを行いました。 ▼結論から言えばとても深刻な内容です。テキストのコンテンツもぜひツイッターやFacebook等SNSでシェアをお願い致します（筆者） ▼Here's English Ver.（英語版はコチラ） Translation of what he said in Japanese on YouTube. ダイヤモンド・プリンセスはCOVID-19製造機。なぜ船に入って一日で追い出されたのか。 https://t.co/g2d1C5HSuI @YouTubeさんから　ダイヤモンド・プリンセスに入りましたが、何者かによって１日で追い出されました。感染対策は飛散な状態で、アフリカのそ
https://twitter.com/buffett_code/status/1605488460659392514
- 281 users
- twitter.com/buffett_code
- テクノロジー
- 2022/12/21
PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
- 272 users
- tadaoyamaoka.hatenablog.com
- テクノロジー
- 2022/10/16
PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan
- python
- あとで読む
- 文字起こし
- AI
- whisper
- PC
- プログラミング
- 音声
- 技術
- 音声認識
「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた！」――急遽テレワークを導入した中小企業の顛末記（118）【急遽テレワーク導入！の顛末記】
- 270 users
- internet.watch.impress.co.jp
- テクノロジー
- 2022/11/07
- AI
- あとで読む
- 文字起こし
- 無料
- テキスト
- python
- 人工知能
- OpenAI
- 技術
- GPU
自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
- 206 users
- dev.classmethod.jp
- テクノロジー
- 2023/10/20
自動文字起こしサービスである、OpenAIの﹁Whisper API﹂とAWSの﹁Amazon Transcribe﹂の精度を比較してみたはじめに今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。ストリーミングとバッチ処理のどちらでも文字起こしが可能です。攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する﹁Whisper﹂という音声認識モデルがあり、WhisperをAPIの形で呼び
- AI
- あとで読む
- aws
- API
- 人工知能
- OpenAI
- APIエコノミー
- Amazon Web Services
- techfeed
音声文字起こしサービス徹底検証　ベストな選択はこれだ！
- 201 users
- xtrend.nikkei.com
- テクノロジー
- 2021/05/11
話した言葉をテキストデータに変換できる「音声文字起こしサービス」。テレワーク時代の情報共有ツールとして大いに役立つものの、気になるのはその実用性だ。発言の認識精度に加え、大まかな流れや会話の文脈を後から振り返るのに使えるのかどうか。主要な7つのサービスを使用し、比較した。 ※日経トレンディ2021年5月号の記事を再構成ディープラーニングやビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。
- 文字起こし
- あとで読む
- webサービス
- サービス
- web
- ICT
- データ
- service
新・必須ガジェット。テレワークのストレスを全部解決してくれました
- 189 users
- www.gizmodo.jp
- テクノロジー
- 2024/03/28
新・必須ガジェット。テレワークのストレスを全部解決してくれました2024.03.28 17:00Sponsored by HiDock 三浦一紀もう手放せない。最近毎日のように行なっているオンライン会議。自宅にいながら、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返したりすることがストレスになります。また、オンライン会議が増えてきたことで、議事録作成の時間が膨大になってきているのも辛い。さらに、自宅で仕事をする時間が増えると、机の上もごちゃごちゃになりがち。Webカメラにマイク、外付けディスプレイに外付けHDD、その他スマートフォン類の充電などなど、机の上はありとあらゆるケーブル類が這い回っています。作業スペースが狭
Amazon Transcribe：破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。｜Sangmin Ahn
- 173 users
- note.com/sangmin
- テクノロジー
- 2019/11/24
【主要なアップデート】（2020.02.04）「7 関連ノート」のセクションを追加（2020. 01.30）図にImageの番号を追加こんにちは、Choimirai School のサンミンです。 0 はじめに機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。文字起こしは、業者に頼むと１時間に１万円はすると思う。納期も最低２〜３日はかかる。ところが、Amazon Transcribe を使えば１時間で１５０円。そして、２０分もあれば終わる！会話の場合、１０人までだと参加者毎に文字起こしすることも可。言語に関する仕事をされてる方は技術の変化に注目すべき。 https://t.co/G7bJaMin6M — Sangmin @Choimir
音声から文字起こし、AWSのAIサービス「Amazon Transcribe」が日本語に対応
- 172 users
- xtech.nikkei.com
- テクノロジー
- 2019/11/22
米アマゾン・ウェブ・サービス（Amazon Web Services）は2019年11月21日（米国時間）、音声からの文字起こしAI（人工知能）サービス「Amazon Transcribe（トランスクライブ）」の対応言語に、日本語など7言語を追加したと発表した。Amazon Transcribeを利用すると、コールセンターや動画配信などのシステムに日本語の文字起こし機能を組み込みやすくなる。 Amazon Transcribeは保存された音声・動画ファイルからの文字起こしに加え、音声・動画のストリームデータを基にした即時の文字起こしも可能だ。今回はこれらのうち音声・動画ファイルからの文字起こしで日本語に対応した。
- amazon
- あとで読む
- aws
- AI
- 文字起こし
- webサービス
- 機械学習
- サービス
- HotEntry
ポッドキャストをAIで書き起こし「LISTEN」　近藤淳也氏が立ち上げ
- 158 users
- www.itmedia.co.jp
- テクノロジー
- 2023/04/26
AIを使ってポッドキャスト番組を自動で文字起こしするサービス「LISTEN」β版を、はてな創業者の近藤淳也氏が公開した。 OpenAIが提供する書き起こしAPI「Whisper」を使い、配信済みのポッドキャストの内容を文字起こしして公開する。テキストを指定してその部分から音声を再生することもできる。番組にコメントを書き込んだり星を付けて出演者と交流する機能も備えた。約20人のポッドキャスターが既に登録しており、徐々に拡大していく。 Discordコミュニティでユーザーからのフィードバックなどを受け付けている。関連記事 OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始　「gpt-3.5-turbo」も発表 OpenAIは「ChatGPT API」と「Whisper API」の提供を開始した。ChatGPT APIの価格は1000トークン当たり0.002ドル。A
- podcast
- AI
- 文字起こし
- あとで読む
- ChatGPT
- 人工知能
- webサービス
- API
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
- 124 users
- dev.classmethod.jp
- テクノロジー
- 2022/09/23
こんちには。データアナリティクス事業本部機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…？と思っていたのですが… ですが… … … … おお！？(上記はGitHubにあるWER: Word Error Rateのグラフです) これは！？これは結構良さげな数値を出している！？(たぶん) ってことで元音声屋さんとしては、これは試すしかない！ということで動かしてみました！(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
- 音声認識
- AI
- whisper
- あとで読む
- 機械学習
- OpenAI
- python
- 音声
- api
OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
- 121 users
- inoccu.com
- テクノロジー
- 2022/09/26
OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は
- python
- whisper
- あとで読む
- mac
- AI
- インストール
- github
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
- 104 users
- gigazine.net
- テクノロジー
- 2022/09/29
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ
- AI
- 音声
- whisper
- 機械学習
- 文字
- 文章
- 人工知能
- あとで読む
Zoom自動で文字起こし(字幕)
- 104 users
- shinshuedu.blogspot.com
- 学び
- 2020/05/04
Shinshu University - Research Unit of Comparative Education Studies Zoomで話した内容を自動で文字起こしし、字幕のようにして配信する方法を紹介します。難聴者などが遠隔授業を受けやすくしたくて考えましたが、記録も残って便利です。ポイント1 パソコンが2台あれば、あとはすべて無料でできます。ポイント2 画面共有しても途切れません。課題1　ホストが話した時しか文字起こしされません。複数で議論する場合には、Google Docsをメンバーと共有するといいでしょう。 ※試行錯誤中のため、もっといい方法があったら教えてください。
- Zoom
- 文字起こし
- 字幕
- chrome
- 教育
- 授業
- tips
- 研究
- あとで読む
TechCrunch
- 102 users
- jp.techcrunch.com
- テクノロジー
- 2021/03/05
Hyde Park Venture Partners is known for having visibility into more than 90% of mid-continent startups and being early backers of companies like ShipBob, FourKites, G2, LogicGate and Dentologie. When Joanna Strober was around 47, she stopped sleeping. While losing sleep is a common symptom of perimenopause, she first had to go to multiple providers, including driving 45 minutes out of San Fra
- microsoft
- あとで読む
- アプリ
- app
- 翻訳
- ios
- language
- 文字起こし
- 言語
- プロジェクト
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
- 101 users
- ysdyt.hatenablog.jp
- テクノロジー
- 2022/10/13
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。配信中のpodcast番組白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。最初に結論インストール実行方法結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果まとめ追記カタカナ英語完全制覇 whisperくんせんでんせんでん最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
会議の文字起こし、AIで簡単に　各サービスの実力は　デジワザNavi - 日本経済新聞
- 90 users
- www.nikkei.com
- テクノロジー
- 2022/11/06
人が話した内容を文字に起こす作業は骨が折れる。聞き取れずに何度も繰り返し再生しなければならないなど、録音時間の何倍もかかってしまう場合も。会議の議事録作成を頼まれて、うんざりした経験がある人も多いだろう（図1）。最近は、人工知能（AI）による文字起こしサービスが増えているので、これらを利用するのがお勧めだ。録音データをアップロードすれば、あっという間にテキスト化される。スマホアプリを使って、そ
- AI
- あとで読む
- tool
- 人工知能
- techfeed
- app
- business
- ニュース
- *あとで読む
LINEがAI文字起こしアプリを無料提供　話者を聞き分けて記録する「分離機能」も
- 77 users
- www.itmedia.co.jp
- テクノロジー
- 2022/05/24
LINEは5月24日、AI文字起こしアプリ「CLOVA Note」（iOS／Android、Webブラウザ）のβ版をリリースした。利用料は無料。複数の参加者の声を聞き分けて別々に記録する話者分離ができるのが特徴。 LINEのAI音声認識技術「CLOVA Speech」を活用し、音声を文字に変換する。アプリ上で録音した音声を文字起こしできる他、録音済みファイルのアップロードによる認識にも対応。変換できる音声は1カ月につき300分まで。 AIの学習のためにLINEに音声データを提供する場合は1カ月600分まで変換可能。変換の際には認識精度向上のため、参加者の人数や「会議」「日常会話」といった形式、話の内容を大まかに指定する。よく使う単語を登録する機能や音声録音中にブックマークを設定する機能、変換テキストの検索機能も備える。 CLOVA Speechは人間が大量の教師データを用意しなくても学習
- LINE
- 文字起こし
- あとで読む
- アプリ
- 人工知能
- app
- AI
「AIでの音声書き起こし」はどこまで進化したのか【西田宗千佳のイマトミライ】
- 76 users
- www.watch.impress.co.jp
- テクノロジー
- 2024/03/25
TechCrunch
- 76 users
- jp.techcrunch.com
- テクノロジー
- 2020/09/01
Kyle Kuzma is a lot of things. He’s a forward for the Washington Wizards NBA team and a 2020 NBA champion. He’s also a style icon — depending on who you ask — and an angel investor. No
「議事録作成にAIを使った自動文字起こしが便利すぎる!! なので操作をもっと簡単にしてみた」――急遽テレワークを導入した中小企業の顛末記（159）【急遽テレワーク導入！の顛末記】
- 68 users
- internet.watch.impress.co.jp
- テクノロジー
- 2023/10/02
- 文字起こし
- AI
- あとで読む
- 便利
- ツール
- 企業
Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた
- 66 users
- gigazine.net
- テクノロジー
- 2021/03/18
2021年3月3日にリリースされたデスクトップ版Google Chrome 89の安定版で、ブラウザ上で再生される音声やムービーからリアルタイムで字幕を生成する「自動字幕起こし」機能が追加されたことが明らかになったので、実際にどんな感じなのか使ってみました。 Google's Live Caption feature rolling out for Chrome desktop users https://www.xda-developers.com/google-chrome-live-caption-feature-rolls-out-transcribe-speech-videos/ Google's Live Caption is now rolling out to Chrome on desktop | Android Central https://www.androidce
- Chrome
- 音声認識
- google
- ブラウザ
- あとで読む
- gigazine
- tech