株式会社 車輪の再発見

Deploying Drones for the Enterprise

メニュー

Scratch Extensionの記事一覧

ChatGPT4によるドローン・シミュレーター

毎月20ドルを課金されますが ChatGPT Plusにバージョン・アップすると、ChatGPT4経由でDALL-E3(ダリと呼称)という画像生成サービスが使用可能となります。入力する文字列に応じてテキスト、画像での出力がシームレスに実行されるようになっています。

2023年の11月初頭は一度に4枚の画像を生成してくれましたが11月の半ば以降は一度の入力に対して1枚しか描いてくれません。ChatGTPに訊いたところ生成するための様々なリソースが逼迫しているためだとのことです。(まだ2枚描いてもらえるユーザーも居ましたが)

Transforms ection of an AI model

上の図のようにDALL-E3は”Transforme”というAIモデルが採用されていています。
トランスフォーマーモデルは、入力層、アテンション機構、エンコーダ・デコーダ構造、出力層などのコンポーネントで構成されています。
“Transform”は、自然言語処理(NLP)や画像生成などの分野で使用される重要なコンセプトです。
この言葉は、トランスフォーマー(Transformer)モデルに関連しています。
トランスフォーマーは、注意機構(Attention Mechanism)を用いて、大量のデータから複雑なパターンを学習する能力を持ちます。
Googleの研究チームによって初めて紹介され、以来、テキスト、音声、画像など多様なデータを扱う様々なAIアプリケーションで広く使用されています。
GPTシリーズ(GPT-3, GPT-4など)やBERT、DALL-Eなどがトランスフォーマーベースのモデルです。

合成開口レーダーのような変位測定機器で山の変位や、老朽化した鉄道の橋脚の振動(変位)をイメージングした時の概念図も簡単に作れます。

A realistic 3D scene depicting a wildfire scene with a fire truck parked on the side. In the foreground, a firefighter of Japan

災害時におけるドローン調査の想像図を描かせたり。

Chromebook screen displaying a drone simulator interface for a training session.

ChomeBook用のドローン操縦シミュレータのUIを描かせたり。

 A large 50-inch monitor displaying a drone simulator interface for a training session.

ドローン操縦の講習会の座学会場で使われる50インチモニターに臨場感がある画像を描かせたり。

そのままJavaScriptで3Dレンダリング、シミュレーションの物理計算、レンダリングループの基本的な設定のサンプルコードを書かせたりもできます。
但し、JavaScriptのサンプルコードを生成してくれますが、これはトレーニングデータとアルゴリズムに基づいたもので生成されたコードは一般的なプログラミングの知識や標準的なコーディングパターンに基づいています。
ChatGPTではPythonのコードの実行が可能な状態になっています。
この機能を利用して、簡単なPythonスクリプトをテストしたり、データ分析や数学的計算を行うことができます。
しかし、Python以外の言語でのコード実行や複雑なプログラミングタスクの実行はサポートされていません。
「Code Interpreterを起動!」と書き込みめば「Code Interpreterが起動されました!」と答えてくれました。

n image of a drone equipped with a grabber collecting scattered LEGO blocks from a classroom floor and stacking them on a white table

ドローンのFPV動画データをAIで解析し「教室に散らばったレゴ・ブロックを拾って白いテーブルの上に置いて」といった作業をプログラミングなしで実行したりできるようになると思います。

教師は慣れないプログラミングに要する時間が不要になり、より創造性の高い授業ができるようになると思います。

アイデアを具現化の初期段階にはとても便利だと思います。

ARDroneSDKはParrot Anafiにも対応するの?

新しいドローンが発表される時はわくわくします。
最近ではDJI社の新製品がつぎつぎと発表されParrot社はコンシューマー市場でDJIに圧倒されていました。(2社の製品の優劣や機能比較は他の方にお任せします)
さて、7月16日に発売が決まった「Anafi」はカメラが上下180度にチルトするためオーバーハングした構造物や橋梁の裏側や天井部分を撮影できたり、Dolly Zoom(台車で前後に移動しながらのズーム撮影する手法)とか、産業分野から芸術分野に至るまで撮影のアイデアを刺激する機能が実装されています。いっそBullet time one Cameraまでできるようにして欲しいと妄想してしまいます。2010年にAR.DroneといったネーミングでドローンとARに注目したドローンをリリースした会社ですから、さまざまなユニークな機能が実装されても不思議ではないかもしれませんね。

「Rolling Spider」は壁を登り天井を走り、「Mambo」はキャノン砲を撃ったりグラバーで物を掴むことが出来るガジェットで童心に返らせてくれました。
小学校ではキャノン砲での打ち合いが一番人気がありました。たとえ2~3mの射程しかないとしても。
そんな仕掛けは機体の大きさや価格に関係なくわくわくさせてくれました。
(ついでに言うとARDroneSDK(Github)にはコマンドが実装されていてmambo用のダブルアームタイプのLEDライトなども製品として企画されていたようです)

ARDroneSDKはParrot Anafiにも対応するの?

前置きがとても長くなりましたが、結論からいうと対応するようです。
ParrotのDevelopers Forumを読むとParrotの中の人はオープンソースであるARDroneSDKは「Anafi」にも対応するとのことです。
続きを読む

最近の投稿

アーカイブページ(サイド2)222

アーカイブページ(サイド2)