هوش مصنوعی

مشاوره و آموزش در حوزه مهارت ها

شنبه ۲۲ دی ۰۳

آموزش دیپ لرنینگ چگونه می توان با استفاده از دیپ لرنینگ در پایتون ، FaceID را در آیفون X اجرا کرد؟

۱۱۵ بازديد

مقدمه:

یکی از ویژگی های بحث برانگیز آیفون X روش باز کردن قفل با استفاده از تشخیص چهره ( FaceID ) است که جایگزین TouchID شده است. اپل پس از ساخت تلفن بدون حاشیه، مجبور شد روش جدیدی را برای باز کردن قفل گوشی به شکلی آسان و سریع ایجاد کند. در حالی که برخی از رقبا به قرار دادن سنسور اثر انگشت در موقعیتی جدید بسنده کردند، اپل تصمیم گرفت در شیوه باز کردن تلفن روشی نوآورانه و انقلابی را ایجاد کند؛ یعنی نگاه کردن به صفحه نمایش گوشی! به لطف بهره گیری از یک دوربین جلوی پیشرفته و بسیار کوچک، آیفون X قادر به ایجاد نقشه سه بعدی از چهره کاربر است. علاوه بر این، تصویری از چهره کاربر با استفاده از یک دوربین مادون قرمز ضبط می شود که نسبت به تغییرات در نور و رنگ محیط پایداری بیشتری دارد. با استفاده از دیپ لرنینگ ، تلفن های هوشمند قادر هستند با جزئیات کامل تری چهره کاربر را ضبط کنند، بنابراین هر بار که تلفن توسط صاحب آن برداشته می شود او را تشخیص می دهند. در کمال تعجب، اپل اظهار داشته است که این روش حتی از TouchID نیز ایمن تر بوده و میزان خطای برجسته آن ١:١٠٠٠٠٠٠ است.
ما به نحوه ایجاد این فرآیند با استفاده از دیپ لرنینگ و چگونگی بهینه سازی هر مرحله تمرکز کردیم. در این مقاله، نشان می دهیم که چگونه الگوریتم شبیه به FaceID را می توان با استفاده از Keras پیاده سازی کرد. آزمایش های نهایی با استفاده از Kinect، یک دوربین RGB بسیار محبوب، که دارای خروجی بسیار مشابه دوربین های جلوی آیفون X است، انجام شده اند.

مفهوم FaceID:

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

فرآیند تنظیم FaceID

شبکه های عصبی FaceID عملکرد پیچیده ای دارند. اولین قدم، تجزیه و تحلیل دقیق نحوه عملکرد FaceID در آیفون X است. در TouchID، کاربر مجبور است ابتدا با لمس مکرر حسگر، اثر انگشت خود را ثبت کند. پس از حدود ١۵ نمونه گیری مختلف، تلفن هوشمند فرایند ثبت را تکمیل کرده و TouchID آماده فعالیت خواهد بود. به طور مشابه در FaceID نیز کاربر باید صورت خود را ثبت کند. فرایند بسیار ساده است: کاربر فقط به گوشی نگاه می کند و سپس به آرامی سرش را به دنبال یک دایره می چرخاند. بنابراین صورت در حالت های مختلف ثبت می شود. حالا قفل صفحه نمایش آماده فعالیت است. این روش ثبت سریع  و شگفت آور می تواند در مورد الگوریتم های یادگیری اساسی چیزهای زیادی به ما بگوید. به عنوان مثال، شبکه های عصبی در FaceID تنها عمل طبقه بندی را انجام نمی دهند. انجام طبقه بندی برای یک شبکه عصبی به معنای یادگیری این است که آیا شخصی که به آیفون نگاه می کند کاربر واقعی آن است یا خیر. بنابراین باید از برخی داده های آموزشی جهت پیش بینی “درست” یا “نادرست” استفاده کند. اما علی رغم موارد متعدد استفاده از دیپ لرنینگ ، در اینجا این رویکرد مؤثر نیست. ابتدا شبکه عصبی باید با استفاده از داده های جدید به دست آمده از چهره کاربر، آموزش ببیند. این امر نیازمند زمان، انرژی و داده های آموزشی از چهره های مختلف برای تشخیص تصویر است. بعلاوه، این روش امکان آموزش اپل در حالت آفلاین را فراهم نمی کند. اما FaceID با شبکه عصبی پیچشی Siamese (توضیح در بخش بعد) طراحی شده که در حالت آفلاین توسط اپل برای ثبت چهره آموزش می بیند.

چهره ها و اعداد در شبکه های عصبی ( شبکه عصبی Siamese )

یک شبکه عصبی Siamese اساسا از دو شبکه عصبی یکسان تشکیل شده است که تمامی وزن ها را نیز به اشتراک می گذارد. این معماری می تواند محاسبه فاصله بین نوع خاصی از داده ها مانند تصاویر را بیاموزد. به این صورت که داده از طریق شبکه Siamese منتقل شده و شبکه عصبی آن ها را در یک فضای n بعدی ترسیم می کند. سپس به شبکه آموزش داده می شود تا این ترسیم را تا زمانی که نقاط مختلف داده ها در طبقه بندی های مختلف تا حد ممکن به یکدیگر نزدیک شوند، ادامه دهد. در دراز مدت، شبکه یاد می گیرد که مهمترین ویژگی ها را از داده ها استخراج کرده و آن ها را در یک آرایه فشرده سازی کرده و یک ترسیم معنی دار ایجاد کند. برای درک درست این موضوع تصور کنید که چگونه نژادهای مختلف سگ ها را با استفاده از یک نمودار کوچک توصیف می کنید؟ به این صورت که سگ های مشابه، نمودارهای نزدیک تری دارند. احتمالا برای رمزگذاری رنگ سگ از یک عدد استفاده می کنید، برای مشخص کردن اندازه سگ از عددی دیگر، برای شکل گوش ها از عددی دیگر و غیره. به این ترتیب، سگ هایی که به یکدیگر شباهت دارند، نمودارهایی مشابه یکدیگر خواهند داشت. یک شبکه عصبی Siamese می تواند یاد بگیرد که این کار را برای شما انجام دهد، مشابه کاری که یک کدگذار خودکار انجام می دهد.

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

 توجه کنید که معماری شبکه عصبی چگونه شباهت بین ارقام را یاد می گیرد و به طور خودکار آنها را در دو بعد دسته بندی می کند. تکنیک مشابهی روی صورت ها اعمال می شود.

با استفاده از این تکنیک می توان از تعداد زیادی چهره برای آموزش استفاده کرد تا تشخیص دهد که کدام چهره بیشترین شباهت را دارد. با داشتن بودجه کافی و قدرت محاسباتی (همانند اپل )، می توانید از مثال های سخت تری نیز استفاده کنید تا شبکه عصبی به مواردی همچون دوقلوها ، حملات خصمانه (ماسک) و غیره واکنش نشان دهد.

مزیت نهایی استفاده از دیپ لرنینگ در تشخیص تصویر

اینکه شبکه می تواند کاربران مختلف را بدون هیچ آموزش دیگری تشخیص داده و محاسبه کند که چهره کاربر، پس از گرفتن چند عکس در هنگام تنظیم اولیه، در نقشه نهفته چهره ها قرار دارد یا خیر. علاوه بر این ، FaceID قادر است با تغییرات در ظاهری شما سازگار شود : هم تغییرات ناگهانی (به عنوان مثال ، عینک ، کلاه ، آرایش) و هم تغییرات جزئی (مانند موهای صورت). این کار با اضافه کردن بردارهای چهره مرجع در این نقشه انجام می شود ، که بر اساس ظاهر جدید شما محاسبه می شود.

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

هنگامی که ظاهر شما تغییر می کند، FaceID سازگار می شود

 

اجرای FaceID در Keras

در مورد همه پروژه های دیپ لرنینگ اولین چیزی که ما نیاز داریم داده است. ایجاد مجموعه داده های ما به زمان و همکاری بسیاری از افراد نیاز دارد و این می تواند بسیار چالش برانگیز باشد. به همین دلیل از مجموعه داده های چهره RGB-D موجود در اینترنت کمک گرفتیم. در این مجموعه داده، افراد با اشکال مختلف و جهات مختلف وجود دارند. همان طور که در هنگام استفاده از آیفون اتفاق می افتد.
در ابتدا یک شبکه عصبی پیچشی بر اساس معماری SqueezeNet ایجاد کردیم. شبکه عصبی به شکلی آموزش داده می شود که فاصله بین تصاویر یک شخص را به حداقل رسانده و فاصله بین تصاویر اشخاص مختلف را به حداکثر برساند. پس از آموزش ، شبکه قادر است چهره ها را در آرایه های ١٢٨ بعدی ترسیم کند. به گونه ای که تصاویر یک شخص در کنار هم طبقه بندی شده و از تصاویر افراد دیگر فاصله دارد. این بدان معنی است که برای باز کردن قفل، شبکه فقط باید فاصله بین تصاویر ذخیره شده در مرحله ثبت چهره و تصویری که در هنگام باز کردن قفل دریافت می کند، محاسبه کند. اگر فاصله زیر یک آستانه مشخص باشد، (هرچه کمتر باشد از امنیت بیشتری برخوردار است) قفل دستگاه باز می شود.

آزمایش شبیه سازی FaceID

حال نحوه عمل این مدل را بررسی می کنیم. با شبیه سازی یک چرخه معمول FaceID. ابتدا ثبت چهره کاربر. سپس مرحله باز کردن قفل چه توسط کاربر (که باید موفقیت آمیز باشد) یا توسط افراد دیگرکه نباید قادر به باز کردن دستگاه باشند.
با ثبت چهره شروع می کنیم: یک سری عکس از یک شخص را از مجموعه داده گرفته و مرحله ثبت چهره را شبیه سازی می کنیم.

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

مرحله ثبت تصویر برای یک کاربر جدید با الهام از روند FaceID

 

حال ببینیم چه اتفاقی می افتد اگر همان کاربر سعی کند با حالت های مختلف چهره قفل دستگاه را باز کند.

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

فاصله صورت در فضای تعبیه شده برای همان کاربر

 

از طرف دیگر ، تصاویر RGBD از افراد مختلف به طور متوسط فاصله ١/١ را ایجاد می کند.

اجرای FaceID در Keras و دیپ لرنینگ و دیپ لرنینگ در پایتون و شبکه های عصبی و iphone x

فاصله های چهره در فضای تعبیه شده برای کاربران مختلف

بنابراین، آستانه ای در حدود ۴/٠ باید برای جلوگیری از باز کردن قفل دستگاه توسط دیگران کافی باشد.

آموزش دیپ لرنینگ را در آکادمی آمانج تجربه کنید.

بررسی مهمترین تفاوت های هوش مصنوعی و یادگیری ماشین

۱۱۸ بازديد

هوش مصنوعی و یادگیری ماشین بخشی از علوم رایانه هستند که با یکدیگر ارتباط دارند. این دو فناوری پیشرفته ترین فناوری هایی هستند که برای ایجاد سیستم های هوشمند مورد استفاده قرار می گیرند.اگرچه این دو فناوری مرتبط هستند و حتی گاهی اوقات بسیاری از آنها به عنوان مترادف یکدیگر استفاده می کنند ، اما هنوز هم در موارد مختلفی  این دو اصطلاح کاملا متفاوت میباشند.در این مقاله برخی تفاوت های اصلی بین هوش مصنوعی و یادگیری ماشین و همچنین مرور اطلاعاتی درخصوص هوش مصنوعی و یادگیری ماشین را خواهیم داشت : 

به طور کلی، می توانیم هوش مصنوعی و ماشین لرنینگ  را به صورت زیر تفکیک کنیم:

هوش مصنوعی یک مفهوم بزرگتر از ماشین لرنینگ و با هدف ایجاد ماشینهای هوشمند است که می تواند توانایی رفتاری و تفکر انسان را شبیه سازی کند ، در حالی که ، یادگیری ماشین یک برنامه یا زیر مجموعه هوش مصنوعی  است که به ماشین ها اجازه می دهد از داده ها و اطلاعات بیاموزند بدون اینکه از قبل برنامه ریزی شوند.



هوش مصنوعی چیست؟

هوش مصنوعی

هوش مصنوعی زمینه ای از علم رایانه است که یک سیستم رایانه ای را ایجاد کرده  که می تواند از هوش انسان تقلید کند. هوش مصنوعی از دو کلمه “مصنوعی” و “هوش” تشکیل شده است ، که به معنای “قدرت تفکر انسانی”میباشد . از این رو می توانیم آن را به این صورت تعریف کنیم:

هوش مصنوعی یک فناوری پیشرفته است که با استفاده از آن می توانیم سیستمهای هوشمند ایجاد کنیم که بتوانند هوش انسانی را شبیه سازی کنند.
سیستم هوش مصنوعی نیازی به پیش برنامه ریزی ندارد ، در عوض از  الگوریتم هایی استفاده می کنند که می توانند  با هوش خود کار کنند. شامل الگوریتم های یادگیری ماشینی ازجمله  الگوریتم یادگیری تقویتی و شبکه های عصبی یادگیری عمیق .از جمله کاربردهای هوش مصنوعی به  Siri ، Google’s Alpha ، Go، بازی هایی مانند شطرنج و غیره میتوان اشاره کرد .

به طور کلی و بر اساس توانایی هوش مصنوعی را می توان به سه نوع طبقه بندی کرد:

هوش مصنوعی ضعیف
هوش مصنوعی عمومی
هوش مصنوعی قوی
در حال حاضر ، ما با هوش مصنوعی ضعیف و هوش مصنوعی عمومی کار می کنیم. آینده AI هوش مصنوعی قوی است که گفته می شود از انسان باهوش است..!

یادگیری ماشین چیست؟

آموزش یادگیری ماشین

یادگیری ماشین در واقع  استخراج دانش از داده ها و اطلاعات میباشد. می توان آن را به این صورت تعریف کرد:

یادگیری ماشینی زیر مجموعه ای از هوش مصنوعی است که ماشین ها را قادر می سازد بدون داشتن برنامه ریزی قبلی و با استفاده از داده ها و تجربیات قبلی یاد بگیرند.

یادگیری ماشینی یک سیستم رایانه را قادر می سازد بدون استفاده از داده های گذشته ی خود  ، پیش بینی کند و یا تصمیم گیری کند.

درواقع  بدون برنامه ریزی صریح. یادگیری ماشینی از انبوهی از  داده های ساختاری و نیمه ساختار یافته استفاده می کند تا  بتواند نتیجه دقیقی را ایجاد کند  یا حتی بر اساس آن داده ها پیش بینی کند.

یادگیری ماشینی بر روی الگوریتمی کار می کند که با استفاده از داده های قبلی بتواند بیاموزد. اما این الگوریتم فقط برای دامنه های خاص و محدودی کار می کند، برای مثال اگر ما در حال ایجاد یک مدل یادگیری ماشین برای شناسایی تصاویر سگ ها هستیم ، فقط برای تصاویر سگ نتیجه خواهد داد و اگر داده های جدیدی مانند تصویر گربه ارائه دهیم ،یادگیری ماشینی  پاسخگو نخواهد بود. یادگیری ماشین در موارد مختلفی از جمله سیستم های توصیه کننده آنلاین ، برای الگوریتم های جستجوی Google ، فیلتر اسپم ایمیل ، چت بات ها ،دوست یابی در Facebook و غیره مورد استفاده قرار می گیرد.

یادگیری ماشینی

تفاوت های کلیدی بین هوش مصنوعی (AI) و یادگیری ماشین (ML):

هوش مصنوعی  (Artificial Intelligence)

  1. هدف هوش مصنوعی این است که یک سیستم کامپیوتری هوشمند مانند انسان برای حل مشکلات پیچیده ایجاد کند.
  2. هوش مصنوعی یک فناوری است که یک دستگاه را قادر می سازد تا رفتار انسان را شبیه سازی کند.
  3. در هوش مصنوعی ، ما سیستم های هوشمندی را برای انجام هر کاری همانند انسان طراحی میکنیم.
  4. یادگیری ماشین و یادگیری عمیق دو زیر مجموعه اصلی هوش مصنوعی هستند.
  5. هوش مصنوعی دامنه بسیار گسترده ای دارد.
  6. هوش مصنوعی در حال تلاش برای ایجاد یک سیستم هوشمند است که می تواند کارهای پیچیده مختلفی را انجام دهد.
  7. دغدغه سیستم هوش مصنوعی افزایش و به حداکثر رساندن شانس موفقیت میباشد.
  8.  نمونه کاربردهای هوش مصنوعی: Siri ، پشتیبانی مشتری ، سیستم Expert ، بازی های آنلاین نظیر شطرنج ، روبات های هوشمند  انسان نما و…
  9. براساس قابلیت ها ، هوش مصنوعی  را می توان به سه نوع تقسیم کرد:  Weak AI ، General AI و Strong AI.
  10. هوش مصنوعی شامل یادگیری ، استدلال و تصحیح خود می باشد.
  11. هوش مصنوعی با داده های ساختاری ، نیمه ساختار یافته و بدون ساختار سروکار دارد.

یادگیری ماشین (Machine learning)

  1. هدف ML این است که ماشین ها بتوانند از داده ها یاد بگیرند تا بتوانند بازده دقیقی داشته باشند.
  2. یادگیری ماشینی زیر مجموعه ای از هوش مصنوعی است که به یک ماشین امکان می دهد بطور خودکار از داده های گذشته و بدون برنامه نویسی صریح یاد بگیرد.
  3. در ML ، ما به ماشین آلات به کمک داده ها آموزش می دهیم که یک کار خاص را انجام دهند و نتیجه دقیقی بگیرند.
  4. یادگیری عمیق زیر مجموعه اصلی یادگیری ماشین است.
  5. یادگیری ماشین دامنه محدودی دارد.
  6. یادگیری ماشینی در تلاش است تا ماشینهایی بسازد که بتوانند تنها وظایف خاصی را که برای آنها آموزش دیده اند ، انجام دهند.
  7. دغدغه یادگیری ماشینی عمدتاً الگوهای یادگیری و دقت عمل در آن ها میباشد.
  8.  نمونه کاربردهای ماشین لرنینگ عبارتند از سیستم های توصیه گر آنلاین ، الگوریتم های جستجوی گوگل ، ربات های چت، دوست یابی در شبکات اجتماعی و غیره.
  9. یادگیری ماشینی به سه نوع تقسیم میشود که عبارتند از: یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویت شونده .
  10. ماشین لرنینگ شامل یادگیری و تصحیح خود با داده های جدید و قدیمی میباشد.
  11. یادگیری ماشین تنها با داده های ساختاری و نیمه ساختار یافته سروکار دارد.

اتوموبیل های خودران چگونه به واقعیت تبدیل می‌شوند؟

۱۱۸ بازديد

دهه گذشته شاهد پیشرفت فزاینده ای در فناوری اتومبیل های خودران بوده ایم که عمدتاً از پیشرفت در زمینه دیپ لرنینگ و هوش مصنوعی ناشی می شد. در آینده ای نه چندان دور اتومبیل های خودران  ایمن ترین وسایل نقلیه در جاده ها خواهند بود. اگرچه امروزه بسیاری از وسایل نقلیه از ” سیستم های کمک راننده ” استفاده می کنند؛ اما همچنان اتومبیل ها نیازمند انسان ها هستند. صنعت خودروسازی با استفاده از مجموعه ای بسیار قوی تر از داده های حسگر و امکان پردازش سریع این داده ها؛ در پی ایجاد یک اتومبیل کاملا مستقل است.
ظهور اتومبیل های خودران در زندگی انسان ها باعث کاهش تصادفات جاده ای، کاهش ترافیک و تسهیل رفت و آمد در شهرهای پر ازدحام خواهد شد.

 

 

نقش دیپ لرنینگ در پیشرفت اتومبیل های بدون راننده

در طی یک دهه گذشته، یادگیری عمیق و هوش مصنوعی به اصلی ترین فناوری ها در پیشرفت بسیاری از تکنولوژی ها از قبیل روباتیک، پردازش زبان طبیعی، سیستم های ضد کلاهبرداری و اتومبیل های بدون راننده تبدیل شدند.
در این راستا، هوش مصنوعی، دیپ لرنینگ و شبکه های عصبی می توانند در این سه زمینه موثر باشند:
• استفاده از داده های حسگر به منظور طراحی صحنه
• تشخیص علائم و قوانین رانندگی
• یادگیری مداوم به منظور بهبود ایمنی و عملکرد
در حال حاضر، سیستم های کمک راننده، عملکردهای رانندگی نظیر: مسیریابی، کنترل حرکت بین خطوط، جلوگیری از تصادف و پارک کردن را کنترل می کنند. اما آن ها قادر به رانندگی بدون حضور انسان نیستند. حال آنکه هوش مصنوعی و فناوری های یادگیری عمیق، با استفاده از حسگرهای پیشرفته و نقشه برداری مسیر، کمک می کنند تا اتومبیل ها کاملاً خودمختار و ایمن تر از خودروهای رانده شده توسط انسان حرکت کنند.
مسیر پیشرفت اتومبیل های خودران دارای چندین سطح است:
• سطح ٠: اتومبیل به طور کامل توسط انسان هدایت می شود.
 سطح ١: فرمان، ترمز، شتاب، پارکینگ و سایر کارکردها می توانند به صورت اتوماتیک توسط اتومبیل انجام شوند، اما راننده همیشه آماده است تا کنترل اتومبیل را به دست بگیرد.
• سطح ٢: حداقل یک سیستم کمک به راننده کاملا خودکار وجود دارد (مانند کنترل سرعت و مسیر حرکت) اما راننده هوشیار است تا در صورت عدم موفقیت سیستم، حوادث یا اشیاء را تشخیص داده و عکس العمل نشان دهد.
• سطح ٣: رانندگان می توانند هنگامی که شرایط محیطی و ترافیکی را مناسب دیدند، عملکردهای اصلی را به طور کامل به وسیله نقلیه واگذار کنند. در این سطح، برخلاف سطوح قبلی، نیازی به نظارت دائمی توسط راننده وجود ندارد.
• سطح ۴: وسیله نقلیه کاملاً خودمختار بوده و قادر به انجام کلیه عملکردهای مهم رانندگی در ایمنی و نظارت بر شرایط جاده برای یک سفر کامل است.
• سطح ۵: وسیله نقلیه کاملا خودمختار عمل می کند؛ و به اثبات می رسد که بهتر از یک انسان رانندگی می کند.
امروزه بیشتر اتومبیل های موجود در جاده ها در سطح صفر قرار دارند؛ در حالی که بسیاری از وسایل نقلیه تولید شده در چند سال گذشته دارای استقلال سطح ١یا ٢ هستند. سطوح بالاتر نیازمند هوش مصنوعی هستند. سطح ۴ و ۵ با استفاده از فناوریهای پیشرفته یادگیری عمیق ساخته خواهد شد.

نیازهای عملکردی در رانندگی بدون راننده

رانندگی بدون راننده نیاز به مجموعه ای پیچیده از عملکردهای پیشرفته برای سنجش آنچه اتفاق می افتد دارد. نقشه برداری از مسیر، ایجاد سیاست های رانندگی برای مقابله با موقعیت های قابل پیش بینی و غیرقابل پیش بینی نمونه هایی از آن هستند.

حسگر:

بیشتر اتومبیل های هوشمند برای درک محیط رانندگی از: LiDAR (روشی که از نور لیزر برای اندازه گیری فاصله استفاده می کند)، رادار (برای تشخیص اشیاء) و دوربین های دیجیتال استفاده می کنند. آن ها شرایط را بررسی کرده و تحلیل می کنند:
• اشیاء ساکن مانند محدوده جاده، گارد ریل ها و خطوط مخصوص دوچرخه
• اشیاء متحرک از جمله سایر وسایل نقلیه ، عابرین و دوچرخه ها
• داده ها و علائم مانند خطوط، مناطق پارکینگ، علائم راهنمایی و رانندگی و چراغ ها

سنجش دقیق در اتومبیل های بدون راننده :
اتومبیل های خودران و اتومبیل های بدون راننده و رانندگی بدون راننده و دیپ لرنینگ و شبکه های عصبی
شکل ١: سنسورهای چندگانه ، وسایل نقلیه خودمختار را قادر می سازند تا هم اشیاء متحرک و هم ایستا را با دقت تشخیص دهند. این سنسورها صحنه را در کل حاشیه خودرو چندین بار در ثانیه ردیابی و طبقه بندی می کند.

 

مسیریاب:

اتومبیل های هوشمند از داده های GPS برای رسیدن باز نقطه A به نقطه B استفاده می کنند. اما همچنان به ترجیحات راننده نیز نیاز دارند تا نقشه برداری از مسیر را تا حد امکان کارآمدتر کنند.

 

سیاست رانندگی:

سیستم های خودکار باید بدانند چه زمانی خطوط را عوض کرده یا سرعت را تغییر دهند. رانندگان انسانی مجموعه ای از سیاست ها را متناسب با سبک رانندگی و شرایط رانندگی خود ایجاد می کنند. اتومبیل های بدون راننده نیز برای اتخاذ تصمیمات ایمن، به مجموعه ای از سیاست های جامع نیاز دارند.
سیستم عامل های اتوموبیل های خودران باید:
o به طور پیوسته اجرا شوند
o قادر به فعالیت ایمن در شرایط سخت ( هوای بد یا ترافیک سنگین) و شب باشند
o به رفتار غیر قابل پیش بینی سایر وسایل نقلیه، عابرین، تعمیرات جاده ای و غیره بدون درصد خطا واکنش نشان دهند.
هر یک از این نیازها بیانگر چندین چالش در فناوری است. یکی از مهمترین الزامات که به درستی توسط یادگیری عمیق پوشش داده می شود؛ توانایی درک کل تصویر در لحظه است (که توسط چندین سنسور شکل می گیرد).

شبکه های عصبی صحنه را ترسیم می کنند

سخت افزار سنسور داخلی ساخته شده توسط تسلا: شامل ٨ دوربین فراگیر، ١٢ سنسور فراصوت به علاوه رادار روبرو است. همه این سنسورها چندین بار در ثانیه داده ها را جمع آوری می کنند.
اگر سنسورها را چشم یک وسیله نقلیه در نظر بگیریم، شبکه های عصبی مصنوعی به عنوان قشر مغز عمل کرده و داده های حسگر را به یک تصویر قابل استفاده از فضای جاده تبدیل می کند. شبکه های عصبی صحنه اطراف اتومبیل در حال حرکت را نقاشی می کنند، حد مجاز سرعت ارسال شده را خوانده و از آن پیروی می کنند. علامت توقف و چراغ سبز را تشخیص می دهد؛ افراد، مشاغل و حتی زباله های موجود در جاده را شناسایی می کنند.

تشخیص خطر اتومبیل:
اتومبیل های خودران و اتومبیل های بدون راننده و رانندگی بدون راننده و دیپ لرنینگ و شبکه های عصبی
شکل ٢: اتومبیل ها با قابلیت انتقال هشدارهای ایمنی، می توانند حضور موانع پیش رو را به اتومبیل های پشت سر خود اطلاع دهند تا از بروز حوادث جلوگیری کنند.
مهندسی نرم افزار فعلی و ابزارهای مبتنی بر قوانین، به اندازه کافی قدرتمند نیستند تا مشکلات پیچیده ای مانند تفسیر داده های سنسور و رانندگی مستقل را حل کنند. متغیرهای بسیار زیادی وجود دارد. مسائل پیش بینی نشده بسیاری وجود دارد که انسان باید آن ها را پیش بینی کرده و برایشان برنامه ریزی کند.
اساسی ترین تکنولوژی های یادگیری عمیق استفاده شده در اتومبیل های بدون راننده عبارتند از: شبکه های عصبی پیچشی، شبکه های عصبی بازگشتی و شبکه های عصبی تقویتی.

شبکه های عصبی پیچشی (CNN):

شبکه های عصبی پیچشی عمدتا برای پردازش اطلاعات مکانی مانند تصاویر مورد استفاده قرار می گیرند؛ و می توان آنها را به عنوان استخراج کننده ویژگی های تصویر مورد استفاده قرار داد. قبل از ظهور یادگیری عمیق سیستم های بینایی رایانه ای بر اساس ویژگی های دستی به کار گرفته می شدند. شبکه های عصبی پیچشی را با تقریبی می توان با قسمتهای مختلف قشر بینایی پستانداران مقایسه کرد.

شبکه های عصبی بازگشتی(RNN):

در بین روشهای یادگیری عمیق ، شبکه های عصبی بازگشتی در پردازش داده هایی مانند متن یا جریان های ویدیویی عملکرد خوبی دارند. برخلاف شبکه های عصبی پیچشی، شامل یک حلقه بازخورد وابسته به زمان در سلول حافظه خود هستند.

شبکه های عصبی تقویتی (DRL):

در شبکه های عصبی تقویتی یک عامل قادر به یادگیری در محیطی تعاملی با استفاده از آزمون و خطاها و تجربه های خود است. در رانندگی بدون راننده با این روش، وظیفه اصلی، یادگیری سیاست های رانندگی بهینه از نقطه ای به نقطه دیگر است.
مهمترین امر برای آینده رانندگی بدون راننده، دیپ لرنینگ و شبکه های عصبی هستند؛ که یادگیری مداوم از موقعیت ها و شرایط جدید در یک محیط رانندگی در حال تغییر را امکان پذیر می سازند.

جمع بندی:

فناوری اتومبیل های خودران طی یک دهه گذشته پیشرفت ویژه ای داشته اند، خصوصا به دلیل پیشرفت در زمینه هوش مصنوعی و یادگیری عمیق. این اتومبیل ها، سیستم های پیچیده ای هستند که می بایست با خیال راحت مسافر یا محموله را از مبدا به مقصد سوق دهند. ظهور و استقرار ماشین های بدون راننده در جاده های عمومی با چالش های بسیاری روبرو است. مهمترین چالش این است که، سیستمهای یادگیری عمیق به پایگاههای داده آموزشی بزرگ متکی هستند و به سخت افزار محاسباتی گسترده نیاز دارند.