این مقاله بخشی از سری VB Lab Insights است که توسط Capital One پرداخت شده است.
برای شرکتهای مبتنی بر ابر، توانایی استفاده از مقادیر تقریباً نامحدود داده میتواند فرصتهایی را باز کند که منجر به محصولات و تجربیات نوآورانهتر برای مشتریان شود. اما داده های بیشتری که از منابع بیشتر به دست می آید نیز می تواند منجر به چالش هایی شود.
شاید زمانی که به آن نیاز دارید نتوانید داده های مناسب را پیدا کنید. شاید در هنگام پیدا کردن دادهها در دسترسی به آن مشکل داشته باشید. شاید باز کردن اطلاعات ارزشمند از داده های شما نیاز به پردازش بسیار زیادی داشته باشد. و هنگامی که پلتفرمهای داده ابری برای محاسبه بر اساس مصرف هزینه میگیرند، همانطور که بیشتر انجام میدهند، ناکارآمدی میتواند منجر به هزینههای غیرضروری شود که باعث میشود ارزش باز کردن قفل دادههای خود را از اولویت خارج کنید.
هنگامی که داده ها در محل ذخیره می شدند، کمتر نگران مدیریت این ناکارآمدی ها بودید. محدودیتهایی مانند قدرت محاسباتی یا پردازش محدود وجود داشت که از خرج کردن بیش از حد جلوگیری میکرد. این قیدها در فضای ابری جدا میشوند و شما میتوانید هر زمان که به آن نیاز داشتید، بهصورت بینهایت مقیاسبندی کنید. این امر مستلزم تمرکز شرکتها بر بهینهسازی دادهها برای مدیریت ناکارآمدیهایی است که نتیجه این قدرت است یا خطر افزایش هزینهها را به دنبال دارد.
یک راه حل سریع، کنترل دقیق نحوه دسترسی و استفاده کارکنان از داده ها خواهد بود. اما این می تواند سرعت نیاز یک کسب و کار را برای ایجاد بینش و تصمیم گیری آگاهانه محدود کند. پاسخ هوشمندانه دسترسی کارکنان به دادههای مرتبط و با کیفیت برای کمک به نوآوری و تمرکز بر بهینهسازی استراتژیک برای مدیریت کارآمد آن دادهها است.
این در مورد متعادل کردن هزینه و عملکرد است
قبل از بهینه سازی، باید ارزیابی کنید که کدام پلتفرم داده ابری مناسب مورد استفاده شما است. هنگامی که تصمیم گرفتید، به پیامدهای هزینه بالقوه برای مورد استفاده فکر کنید (یعنی هزینه های ذخیره سازی، هزینه های بارگذاری، قدرت محاسباتی) و آن را با ارزش بالقوه ای که می توانید از آن مورد استفاده به دست آورید متعادل کنید. اگر مناسب است، میتوانید روی مدیریت ناکارآمدیها تمرکز کنید.
حتی زمانی که تصمیم درستی برای استفاده خود گرفته اید، ناکارآمدی وجود خواهد داشت. همه افراد در پلت فرم داده های ابری شما در اجرای کارآمدترین موارد استفاده متخصص نیستند، بنابراین مهم است که معلمان را از یک لحظه تدریس خارج کنید. بر روی دید، هشدار و توصیه ها تمرکز کنید. این به این معنی است که ناکارآمدیهای بالقوه را در معرض دید کاربران قرار میدهد، به سرعت به کاربران هشدار میدهند که ناکارآمدیها را بهسرعت آگاه میکنند و توصیههایی برای بهینهسازی ناکارآمدی ایجاد میکنند – همه اینها در عین حال که آن را به یک لحظه آموزشی تبدیل میکند.
در بخش بهینهسازی، چهار حوزه بهینهسازی داده وجود دارد که به شما کمک میکند کارآمدتر عمل کنید، سریعتر مقیاس کنید و بیشترین ارزش را از دادههای خود دریافت کنید:
۱٫ محاسبه بهینه سازی
شما همیشه به یک اندازه محاسباتی نیاز ندارید. حجم کار بسته به روز هفته و ساعت روز متفاوت است. شما می توانید اندازه های مختلف انبار را بر اساس نحوه اجرای پرس و جوها برنامه ریزی کنید و به طور بالقوه در منابع زیادی صرفه جویی کنید.
۲٫ بهینه سازی پرس و جو
یک پرس و جو بد نوشته شده می تواند محاسبات اضافی را بگیرد یا داده های بسیار بیش از حد مورد نیاز را اسکن کند. کاربران همچنین می توانند همان پرس و جو را بیش از زمان مورد نیاز اجرا کنند. این ناکارآمدی ها می توانند پول را هدر دهند و بینش های بالقوه را کاهش دهند. آموزش کاربران در مورد نوشتن پرس و جو می تواند به جلوگیری از رفتارهای ناخواسته کمک کند، و مکانیسم های هشدار می توانند زمانی که یک پرس و جو برای مدت طولانی تر از حد انتظار اجرا می شود یا زمانی که نباید اجرا می شود، هشدار دهند.
۳٫ بهینه سازی مجموعه داده
تکنیکهای مدلسازی داده سنتی بر نحوه بهینهسازی پلتفرم دادههای ابری خود تأثیر میگذارند، بنابراین باید به تصمیمگیریهای پیرامون طرحواره ستارهای، جداول انبوه و نمای واقعی توجه کنید. هنگام مدیریت پتابایت داده در فضای ابری، برای جابجایی، آرشیو یا پاکسازی دائمی دادهها پس از یک دوره زمانی خاص، به یک استراتژی حفظ نیاز دارید و نحوه بارگیری دادهها نیز مورد توجه است. آیا داده هایی را بارگیری می کنید که مردم به آنها دسترسی ندارند؟ آیا دادههایی را در زمان واقعی بارگیری میکنید که به ندرت به آنها دسترسی پیدا میکنید؟ اطمینان حاصل کنید که مدیریت مجموعه داده شما با مورد استفاده واقعی شما مطابقت دارد تا از هزینه های غیر ضروری جلوگیری شود.
۴٫ بهینه سازی محیط
مراقب کنترل هزینه ها در محیط توسعه باشید، که می تواند افزایش یابد. سیاست هایی مانند تجاوز نکردن از محاسبات کوچک در محیط های پایین تر یا خاموش کردن سریع محاسبات در صورت عدم استفاده.
همچنین مواقعی وجود دارد که هزینه کردن برای محاسبات منطقی است. برخی از گزارش های پایان ماه باید سریع اجرا شوند. ممکن است برای رسیدن به یک SLA به محاسبات اضافی نیاز داشته باشید. در این صورت کارایی نیز اهمیت دارد – زیرا میخواهید مطمئن شوید که این فرآیندهای اولویتدار توسط چیزی که نیازی به اجرا ندارد کند نمیشوند.
بهره وری می تواند معانی مختلفی برای شرکت های مختلف داشته باشد. برای برخی، به معنای دویدن با کمترین هزینه ممکن است. برای دیگران، این بدان معنی است که مطمئن شوید که مهم ترین کارها در زمانی که نیاز دارند به پایان می رسند. برای بیشتر، این به معنای ایجاد تعادل کامل بین هزینه و عملکرد است. هنگامی که شرکتها معماری دادههای ابری خود را برای حداکثر کارایی بهینه میکنند، زمان کمتری را برای مدیریت دادههای خود و زمان بیشتری را برای مدیریت کسبوکار خود صرف میکنند.
ابزارهای خوب می توانند کار را آسان تر کنند
ابزار متمرکز لایه دیگری از مسئولیت پذیری را برای بهینه سازی اضافه می کند. Tooling به کاربران امکان میدهد تا بر افزایشهای غیرمنتظره استفاده نظارت کنند، یا مطمئن شوند که وقتی محاسبات اضافی برای آن گزارش بزرگ پایان ماه آنلاین میشود، به محض اتمام اجرای آن گزارش، خاموش میشود. ابزارها می توانند دید گسترده ای را در استفاده از داده ها ایجاد کنند، الگوهای استفاده جدید را شناسایی کنند و حتی توصیه هایی برای رسیدگی سریع و پیشگیرانه به مشکلات ارائه دهند. ما ساختیم کپیتال وان اسلینگ شات برای کمک به ما در بهینهسازی هزینههایمان، کاهش ضایعات و ناکارآمدیها و سرعت بخشیدن به زمان ارزشگذاری Snowflake، در حالی که به الزامات حاکمیتی پایبند هستیم.
داده ها همیشه در حال تغییر هستند و همیشه نیاز به تمرکز روی بهینه سازی داده های خود برای رسیدن به حداکثر کارایی وجود دارد. وقتی کارآمدی کار میکنید، میتوانید نویز را کاهش دهید و از دادههای خود اطلاعاتی دریافت کنید. این به نوبه خود کمک میکند تا نتایج کسبوکار را افزایش دهید، مانند دستیابی به استراتژی قیمتگذاری مناسب، سریعتر از هر شخص دیگری، آماده شدن برای پاسخ به بلایای طبیعی بدون ایجاد اختلال در تداوم کسبوکار، یا مشاهده الگوهایی که به شما کمک میکند تقلب را قبل از تبدیل شدن به مشکل پیدا کنید. در نهایت، بهینه سازی داده های شما می تواند به بهبود عملکرد و افزایش ارزش تجاری ملموس کمک کند.
سلیم سید معاون و رئیس مهندسی Slingshot در Capital One Software است.
محتوای VB Lab Insights با همکاری شرکتی ایجاد میشود که یا هزینه پست را پرداخت میکند یا با VentureBeat رابطه تجاری دارد، و همیشه به وضوح علامتگذاری میشوند. محتوای تولید شده توسط تیم تحریریه ما هرگز تحت تأثیر تبلیغ کنندگان یا حامیان مالی قرار نمی گیرد. برای اطلاعات بیشتر. برای اطلاعات بیشتر با sales@venturebeat.com تماس بگیرید.
منبع: https://venturebeat.com/data-infrastructure/data-optimization-is-a-must-for-maximum-efficiency/