اپلیکیشن Seeing AI محصول ماکروسافت، چشمی برای نابینایان
اپلیکیشن Seeing AI محصول ماکروسافت، چشمی برای نابینایان
دوره پادشاهی اپلیکیشن هاست، هر سال تعداد زیادی اپلیکیشن برای گجت های هوشمند عرضه می شوند، اپلیکیشن هایی که آمده اند تا مسئله یا مشکلی را حل کنند. در یک نگاه می توان هدف کلی همه آنها را آسان تر کردن زندگی بیان کرد. یک اپ، خرید را برایمان راحت می کند، دیگری مسئولیت یادآوری کارها، قرارها و تولدها را به عهده دارد، آن یکی لذت گوش دادن به موسیقی و دسته بندی آنها را دو چندان می کند، با بعضی از آنها می توانیم حمل و نقل آنلاین راحتی داشته باشیم،
خلاصه برای دهها فعالیت روزانه از برنامه ریزی برای سفر تا فعالیت در شبکه های اجتماعی و پیام رسان ها به این نرم افزارهای کوچک کاربردی محتاج هستیم. کار تا جایی پیش رفته که زندگی بدون آنها برای آنانی که طعم استفاده از گوشی هوشمند را چشیده اند، غیرقابل تصور است. از هدف تکنولوژی برای آسان شدن زندگی انسان ها گفتیم، اما سهم گروه های خاص مانند نابینایان، ناشنوایان، معلولان و … از تکنولوژی چقدر است؟
نگاه ویژه مایکروسافت و هدفش برای ساخت دنیایی بهتر برای نابینایان باعث شد به جای اپلیکیشن های هزار رنگی که امسال عرضه شده اند، «Seeing AI» مایکروسافت را به عنوان اپ برگزیده سال انتخاب کنیم؛ اپلیکیشنی با امکاناتی فوق العاده که نوعی سرگرمی هم هست، قصد دارد مرهمی بر ناتوانی انسان ها باشد و از همان ابتدای عرضه، بسیاری از کارشناسان آن را تحسین کرده اند.
چشم اندازی برای آینده
یکی از قابلیت های آزمایشی اپ که به مرور بهتر خواهد شد این است که یک عکس از محیط اطراف خود می گیرید و Seeing AI آن را توصیف می کند. به عنوان مثال می گوید: «گوشه ای از خیابان با علائم راهنمایی و رانندگی» یا «دو سگ و یک نفر در چمن».
اپلیکیشن دوربین سخنگو
مایکروسافت در توضیح این اپ نوشته: «یک برنامه رایگان که جهان اطراف شما را روایت می کند، این پروژه تحقیقاتی برای جامعه کم بینا طراحی شده تا افراد، متن و اشیا را برای آنها توصیف کند.» Seeing AI، یکی از پروژه های تحقیقاتی مایکروسافت است که از قدرت فناوری ابری و AI استفاده می کند تا یک اپ باهوش عرضه و یک نابینا را در طول روز هدایت کند.
به وسیله این اپ، دوربین گوشی فرد نابینا جای چشمش را می گیرد و هر چه را می بیند برای او شرح می دهد. Seeing AI دنیای بصری را به یک تجربه قابل شنیدن تبدیل می کند. با استفاده از این اپ دوربین هوشمند، کافی است گوشی خود را در دست بگیرید و صدای اطلاعات اطراف خود را بشنوید. Seeing AI دوستان شما، حالت چهره و حتی سن تقریبی آنها را تشخیص می دهد. همچنین متون کوتاه و اسناد را برای شما می خواند.
چراغی در تاریکی
کاربران می توانند از هر چیزی عکس بگیرند و اطلاعات مربوط به آن را دریافت کنند. یکی از دلایلی که Seeing AI در زمانی کوتاه توانست به محبوبیت برسد، علاوه بر رایگان بودن، این است که همه ویژگی هایی که در ادامه می خوانید، در یک اپلیکیشن واحد ترکیب کرده است. معمولا کاربران برای بهره بردن از هر کدام از این قابلیت های فهرست شده، به یک یا چند برنامه (معمولا پولی) نیاز دارند.
خواندن متن خواندن متن Seeing AI شامل دو مد OCR می شود:
متون کوتاه (Short Text) و اسناد (Document). مد یا حالت استاد مانند بسیاری از اپ های تشخیص متن از جمله KNFB-Reader کار می کند. در این مد کافی است دوربین گوشی خود را به سمت صفحه مورد نظر بگیرید و دستورالعمل ها را دنبال کنید تا به شما اطلاع دهد که لبه ها و گوشه ها قابل مشاهده نیستند.
Seeing AI به شما آموزش می دهد که دوربین را ثابت نگه دارید و سپس به طور خودکار عکس می گیرد و آن را برای شناسایی به سرورهای مایکروسافت ارسال می کند. البته می توانید به صورت دستی و با فشار دادن دکمه Take Picture هم عکس بگیرید.
کاربران می توانند از VoiceOver’s Heading، فهرست کردن موارد و دیگر حرکات سریع استفاده کنند. عملیات تشخیص در این اپ کندتر از KNFB-Reader است، زیرا موتور OCR روی دستگاه شما نیست، اما دقیق و صحیح انجام می شود. مدیا حالت متون کوتاه روی دوربین شما روشن می شود و به طور مداوم به دنبال حروف چاپی می گردد.
وقتی متون چاپ شده را پیدا کرد، آن را به متن ماشینی ترجمه و سپس با صدای بلند آن را ادا می کند. حالت متون کوتاه مانند حالت اسناد، دقیق نیست، اما خواندن ایمیل ها و دستورالعمل ها را برای افراد دارای اختلال بینایی آسان تر می کند.
اسکن بارکد
Seeing AI شاید بهترین ابزار روی موبایل برای اسکن بارکدها باشد. ممکن است پیدا کردن بارکد روی یک قوطی یا جعبه برای افراد نابینا مشکل ساز باشد، اما Seeing AI وقتی به بارکد نزدیک می شوید، شروع به بوق زدن می کند و وقتی دوربین گوشی به بارکد نزدیک تر می شود، بوق ها تندتر می شود تا این که سرانجام آپ، بارکد را تشخیص می دهد.
یک دکمه به نام اطلاعات بیشتر (More information) هم وجود دارد که شامل جزئیات بیشتر آن محصول مانند کالری، دستورالعمل پخت و … می شود. تقریبا چند ثانیه طول می کشد تا کد بارگذاری و تصویر آن هم شناسایی شود.
شناسایی صورت
تشخیص افراد، پول و احساسات همگی نوعی تشخیص شیء هستند. کاربران می توانند از هر چیزی عکس بگیرند و اطلاعات مربوط به آن را دریافت کنند. علاوه بر اینها، تشخیص چهره، سوژه داغ این روزهای دنیای تکنولوژی است، به خصوص که «اپل» در آیفون ۱۰ از این فناوری برای باز کردن قفل گوشی استفاده کرده است. مایکروسافت، سازنده Seeing Al هم در اپلیکیشن خود گام بزرگی در زمینه فناوری تشخیص چهره برداشته است.
کاربران می توانند آلبومی از تصاویر دوستان و خانواده خود بسازنند و آپ، وقتی یکی از آنها به کاربر نزدیک می شود، به او اطلاع می دهد. این اپ با تحلیل تصویر فرد می تواند سن و احساساتی مانند لبخند یا خندیدن را تشخیص دهد. همچنین اگر تصویر فردی را از قبل به پایگاه داده Seeing AI داده باشد، نام فرد را هم می گوید. این ویژگی در کنفرانس ها یا جلسات می تواند به افراد در یافتن دوستان و همکاران کمک کند.
اپلیکیشن دنیایی بیکران
یکی از مفیدترین قابلیت های Seeing AI امکان به اشتراک گذاری آن است. از camera roll خود می توانید هر تصویری را انتخاب و آن را به یک ایمیل یا متن ضمیمه کنید. قابلیت Recognize With Seeing AI در Sharesheet بلافاصله تصویر را به اپ ارسال می کند و یک توضیح برای تصویر پیشنهاد می دهد تا تصویر را با متن به اشتراک بگذارید. اگر گزینه Recognize with Seeing AI نمایان نشد، دکمه More را در Sharesheet فشار دهید و آن را روی حالت On قرار دهید.
شاید فکر کنید این آپ تنها برای افراد دچار اختلالات بینایی کاربردی و جذاب است، اما باید بگوییم که شک نکنید حتی افراد بینا هم بعد از یک بار استفاده از آن زبان به تحسین می گشایند. در واقع برای دیگر افراد، این اپ هم کاربردی است و هم سرگرم کننده. این اپ در حال حاضر تنها برای سیستم عامل آی او اس عرضه شده و با نسخه ۱۰ به بالا سازگار است، ولی به نظر می رسد مایکروسافت نسخه اندرویدی آن را هم منتشر خواهد کرد.