ChatGPTに代表される生成AIが、日常的に使われるようになりつつあります。実は、身近なところに導入されているのをご存じでしょうか。そこで今回は、生成AIの種類とできること、主なアプリ一覧に加えて、業務活用時のリスクや課題を見ていきます。生成AIの企業利用について考えてみましょう。
生成AIとは?
まず、生成AI(ジェネレーティブAI)とは何かというところから始めましょう。生成AIとは、自然言語処理(NLP)や大規模言語モデル、深層学習(ディープラーニング)などの技術を用いて、AI自体が新しいコンテンツを作り出す能力を持つものを指します。テキストや画像、音声といったデータの取り扱いが可能で、大量のデータを学習し、その特徴やパターン、規則性を分析して新しいコンテンツを生み出します。
生成AIと従来型AIの違い
従来型AIと生成AIとの大きな違いは、AI自体が新しいコンテンツを生成できるかどうかです。与えられたデータを判別したり分析したりして特定のタスクを実行し、その結果を返すという従来型AIに対し、生成AIは学習したデータから類推して指示に応じた新しいコンテンツを返します。
生成AIの種類とできること
ここでは、生成AIの基本を見ていきましょう。主な生成AIの種類とできることは、以下の通りです。
- テキスト生成AI
- 画像生成AI
- 映像(動画)生成AI
- 音声音楽生成AI
テキスト生成AI
テキスト生成AIは、人間のような言語(テキスト)で応答や文章を生成できます。自然な言語を生成できることから、以下のようなことも可能です。
- 会話
- 文章作成
- 要約
- 校正
- 翻訳
- コード記述
- 情報収集 など
会話を活用した生成AIで代表的なのは、チャットボットでしょう。お問い合わせやカスタマーサポートの窓口として、24時間365日稼働可能です。長期連休や時間に加えて、地域も問わずオンライン対応できることも魅力だといえるでしょう。
文章作成という点では、指示したテーマや状況での文章作成に留まらず、資料を読み込ませて要約させたり、下書きを校正させたりもできます。日本語と英語などの外国語との翻訳も可能ですし、同じ言語という意味で、プログラミング言語でコードの記述も可能です。
インターネット上に公開されている情報を検索するのもお手のものですので、ひとつのテーマやキーワードに関連する記事やサイト、URLなどを拾い集める作業も一瞬で終わります。
画像生成AI
テキストで入力した指示から写真やイラスト、デザイン、ビジュアルイメージ、アートなどのクリエイティブを生成するのが、画像生成AIです。画像をインプットし、修正や加工などができるものもあります。
- 写真やイラスト、3Dなどのイメージ
- グラフィックやロゴ、パッケージなどのデザイン
- ゲームなどのキャラクターデザイン
- インテリアや建築物などのビジュアルイメージ
- アート作品 など
探しているイメージに合う画像やイラストなどの素材がないという場合に、生成AIは役立つでしょう。Webサイトやアプリ、印刷物など、用途は数えきれないほどあります。ロゴや商品パッケージなどのアイデアを提案させたり、キャラクターを何通りもデザインさせたり、建築のパースを起こしたりといった使い方も可能です。自社商品やサービス、ブランドイメージに合うアートやクリエイティブを模索することもできるでしょう。
動画(映像)生成AI
画像生成AIの発展版ともいえるのが、動画(映像)生成AIです。指示の出し方は、大きく3つに分かれます。テキスト入力だけではなく、画像(静止画)や短い動画を読み込ませて動きを加えるという方法です。映像の修正やエフェクトなどの加工、見どころを切り抜くという編集が可能なアプリもあります。
- 映像生成
- 映像の加工や編集
- 自動編集
- 字幕(テロップ)
- 音声(読み上げ)
指示に基づく映像の生成はもちろんのこと、明るさや音声、動画スピードなどの調整やエフェクト、トランジション、BGM、字幕の追加、背景の修正といった加工や編集なども可能です。生成した字幕の読み上げもできます。ダイジェスト版を自動で作る自動編集機能を持つアプリもありますので、工数を大幅に圧縮できるでしょう。
音声音楽生成AI
音声音楽生成AIは、音声や音楽を生成できます。テキストの読み上げをはじめとして、テキストの指示から音声や音楽を読み込ませ、新たなコンテンツを生成可能です。楽曲では、ボーカルや楽器の有無が選べたり、BGMのみの生成もできます。ボイスチェンジャーとして活用できるアプリも登場しています。
- テキストの読み上げ
- 音声合成
- 楽曲やBGM
- ボイスチェンジ
- 外国語対応
例えば、チャットボットが生成した文章を読み上げさせれば、会話を進めるような形でお問い合わせに対応できます。コールセンターなどでは、音声による自動案内で導入されるケースが多く、当たり前のことになってきつつあるといえるでしょう。
楽曲では、編曲にも対応可能です。ボーカロイドに歌わせる楽曲も、今では珍しくありません。ゲームのキャラクターやオリジナルキャラクター、VTuberなどの音声にも利用可能です。ボイスチェンジ機能を使えば、自分の声を変えて使うことも簡単にできます。
また、外国語対応も可能ですので、外国人向けの案内を音声生成AIで対応するという使い方をすれば、言葉の壁も超えられるでしょう。
代表的な生成AI
生成AIの種類とできることを踏まえて、代表的な生成AIを見ていきましょう。生成AIの種類別にまとめました。
種類 | ツール名 | ベンダー | 特徴 |
---|
テキスト生成 | ChatGPT | OpenAI | 生成AIの草分け的存在 |
テキスト生成 | Gemini(旧Bard) | Google | GoogleのAI技術を活用した会話型AI |
テキスト生成 | Llama3 | Meta | Meta社が開発したオープンソースの大規模言語モデル |
テキスト生成 | Claude | Anthropic | OpenAIの好敵手とされるAnthropic社による生成AI |
テキスト生成 | Copilot | Microsoft | 同社製品との連携力の高さが特徴 |
画像生成 | DALL-E 3 | OpenAI | 画像生成AIの火つけ役 |
画像生成 | Midjourney | Midjourney | DALL-Eと並ぶ画像生成AIの先駆け |
画像生成 | Stable Diffusion | Stability AI | オープンソース型の生成AI |
画像生成 | Adobe Firefly | Adobe | Adobe Stockを学習した生成AIで動画にも対応 |
画像生成 | Canva | Canva | ノーコードで直感的に操作可能 |
動画生成 | Gen-2 | Runway | 画像や3Dにも対応する多機能が特徴 |
動画生成 | Sora | OpenAI | 高画質かつ多機能 |
動画生成 | Dream Machine | Luma Labs | 物理法則を活用したリアルな映像表現が可能 |
音声生成 | IBM Watson Text to Speech | IBM | 感情表現もできる高性能な生成AI |
音声生成 | Speechify | Speechify | 難読症を持つ青年によって開発された |
音楽生成 | MusicFX | Google | 直感的な操作で音楽の生成が可能 |
音楽生成 | Boomy | Boomy | 2100万曲以上の利用実績を誇る |
生成AIといえば、その代名詞ともいえるのがChatGPTでしょう。2022年11月に米国で公開され、瞬く間に世界的にユーザー数を増やしていったのは、そう遠い昔のことではありません。この数年間にChatGPT自体も進歩し、音声読み上げや画像生成もできるようになりました。
テクノロジーは、驚くほどあっという間に発展していきます。一部の機能を無料で開放しているツールも少なくありませんし、まずは使ってみるというところから始めてみると良いのではないでしょうか。
企業利用におけるリスクと可能性
利便性の高さが魅力の生成AIですが、利用に際しては注意が必要です。ここでは、企業利用におけるリスクや課題を見ていきましょう。
生成AIの企業利用におけるリスク
- ハルシネーション(AIによる誤情報の生成)
- 偏見など倫理的な課題
- 個人情報や機密情報などの情報漏洩
- 著作権や肖像権などの知的財産権
- 導入や運用コスト
生成AIはどのようなデータを学習したかによって、パフォーマンスが変わってきます。学習データの質と量を確保できるかという問題があることに加え、仮にネット上に公開されている情報を使うとしたら玉石混交で、正しいものもあれば間違っているものもあります。
企業や個人の意見の中には、文化や慣習などの違いから、ほかの文化圏からすると理解に苦しむものもあるでしょう。マイノリティについても、さまざまな意見があります。そうしたセンシティブな問題に、どのように回答するかを調整しなければなりません。
学習データに個人情報や社内の機密情報が含まれていると、流出する可能性があります。また、ユーザーが入力したデータを学習する生成AIの場合、意図せず情報流出を招いてしまう可能性もあるでしょう。学習データの質量を十分に用意できるかも課題です。
人間の世界には知的財産権がありますが、生成AIの世界では、まだしっかりとした法律が整っていません。したがって、既存の権利を侵害するような著作物は訴えられる可能性があります。AIの著作物については、まだ法整備の途上で、議論の段階にあるといえるでしょう。自主的なガイドラインの策定といった対策が求められます。
導入時のコストや運用コストに加えて、管理担当者や責任者といった人材や適任者がいない場合の育成も、生成AIの管理運用には必要です。成果とコストのバランスを考慮した計画的な導入が不可欠だといえるでしょう。
企業が生成AIを業務活用していく必要性
前述したようなリスクや課題があるとわかっていながらも、これからの時代、生成AIをどのように業務活用するかは検討しなければならない課題です。なぜなら、業務効率や生産性などの点で、生成AIは事業運営に大きく影響する可能性があるからです。そのほかにも、生成AIを検討する理由には、以下のようなものがあります。
- 人口減少からくる人材不足
- 進歩しつづけるテクノロジー
- デジタルデバイド(情報格差)
改めて申し上げるまでもないでしょうが、日本の総人口は2008年に1億2808万人でピークを迎え、そこから減少に転じています。企業活動にとって重要度の高い生産年齢人口(15~64歳)は、1995年の8716万人を境に、2020年には7509万人にまで減少しました。35年間で1210万人、約15%の減少です。
総務省 令和4年版 情報通信白書(総務省)
人口増という基盤があって支えてきた経済成長を、今後も同じように維持できないことから、その課題を解決しようとするのが、ITやDXをはじめとするテクノロジーです。原材料費や人件費の高騰、簡単ではない価格改定、競争のグローバル化などの要因もあり、業務効率化や生産性向上、新しい価値の創造に努めなければ、企業として生き残っていけない時代にすでに突入してしまっています。
生成AIを導入している企業は決して珍しくはなく、進歩するテクノロジーにどのように向き合うかが、競争優位に立てるかどうかを決めるといっても過言ではありません。
まとめ
生成AIの進歩には、目覚ましいものがあります。ChatGPTが世の中を席巻してからたった数年の間に、生成AIはさらなる発展を遂げ、AIエージェントと呼ばれる高度なタスクを処理するものまで出始めているのが現状です。
まず、生成AIにはどのような種類があり、何ができるのかを知るところから始めましょう。自社の業務にどのように活用できるかを考えることは、あらゆる企業にとっての課題だと弊社では考えます。
これから先、フィジカル空間(リアル空間)とサイバー空間が高度に融合するSociety5.0に向かう流れは、おそらく加速していきます。新しいテクノロジーとどのように向き合っていくかを決めるのは、各企業の重要な課題です。
なお、弊社では、デジタルマーケティング研修やウェブ広告研修、SEO研修などで生成AIの活用方法を講義の中で触れております。ご興味がございましたら、お問い合わせください。