ফেসবুক টুইটার
esmartjob.com

ডেটা স্ক্রাবিংয়ের জন্য একটি কেস

Raphael Corns দ্বারা সেপ্টেম্বর 3, 2021 এ পোস্ট করা হয়েছে

প্রায়শই রক্ষণাবেক্ষণ সিস্টেমগুলি তাদের নিজস্ব কোনও দোষের মাধ্যমে প্রতিশ্রুতি দেয় এমন সুবিধাগুলি কাটায় না। অন্তর্নিহিত ডেটা বাড়ানোর জন্য আপনি কীভাবে কোনও পদ্ধতি আশা করবেন? সমাধানটি হ'ল আপনি কেবল পারবেন না। আপনার যা যা প্রয়োজন তা হ'ল মেশিনে ভাল ডেটা পাওয়া যাতে এটি আপনার সংস্থার জন্য দরকারী তথ্য সরবরাহ করতে প্রাপ্ত, প্রক্রিয়াজাতকরণ এবং ব্যবহার করা যেতে পারে।

আমাকে উদাহরণ সহ ভাল তথ্য না থাকার দামটি চিত্রিত করার অনুমতি দিন। একটি বহু-সাইট নির্মাতার চারটি অবস্থান রয়েছে, যার মধ্যে তিনটি একে অপরের সাথে মোটামুটি নিকটবর্তী। প্রতিটি ওয়েবসাইটের স্টক উপাদান সহ নিজস্ব স্বায়ত্তশাসিত স্টোররুম রয়েছে। প্রতিটি সাইটে, সমস্ত ডাটাবেস ক্রিয়াকলাপের জন্য দায়ী একটি খণ্ডকালীন ক্যাটালগ ম্যানেজার রয়েছে। যেহেতু উদ্ভিদটি ইউনিয়নযুক্ত এবং অবস্থানগুলি প্রায়শই পরিবর্তিত হয়, তাই ক্যাটালগ ম্যানেজার প্রতি মাসে বা দুই মাসে প্রতিস্থাপন করা যেতে পারে।

ফলস্বরূপ স্টক স্ট্যান্ডার্ডগুলি এটির প্রতিনিধিত্ব করে: বেমানান নির্মাতা নামকরণ; হারানো প্রস্তুতকারকের অংশ সংখ্যা; প্রতীক/সংক্ষিপ্তসারগুলির অসামঞ্জস্য ব্যবহার; বিরামচিহ্ন ভুল; অসম্পূর্ণ বিবরণ এবং; সদৃশ আইটেম। সিস্টেম ওয়ার্ড অনুসন্ধানগুলি অসম্ভবের পাশে এবং একটি অংশ সন্ধান করা হতাশাজনক, চ্যালেঞ্জিং, সাধারণত ব্যর্থ লড়াই।

সব জায়গাতেই যত্ন কর্মীরা দোকানে বিশ্বাস হারিয়েছিলেন; প্রত্যেকে নিজের ব্যবহারের জন্য কোথাও কোথাও লুকিয়ে থাকা উপাদানগুলির একটি স্ট্যাশ রেখেছিল। একটি মেরামত কাজের জন্য পরিকল্পনা করার জন্য, তারা পুরো সিস্টেম জুড়ে অংশগুলি সনাক্ত করার চেষ্টা করবে, তবে তারা যা পছন্দ করেছে তা খুঁজে পেতে না পারলে তারা শিকারটি ত্যাগ করবে এবং কেবল অংশটি ঠিক অর্ডার করবে; কোনও সংকট ঘটলে তারা কোনও অংশের loan ণ জিজ্ঞাসা করতে অন্য কোনও জায়গায় কল করতে পারে। পুরো সংস্থা জুড়ে ইনভেন্টরি মান $ 80 মিলিয়ন শীর্ষে।

কিছু অর্জন করার দরকার আছে তা স্বীকৃতি দিয়ে সংস্থাটি নিজেরাই ডেটা পরিষ্কার করার চেষ্টা করেছিল। তারা চারটি সাইট থেকে দু'জন সমর্থন ব্যক্তি এবং একটি ইনভেন্টরি বিশেষজ্ঞের কেয়ার কর্মচারী (বৈদ্যুতিক, যান্ত্রিক, উপকরণ এবং পাইপ ফিটার) সমন্বিত উনিশটি অভ্যন্তরীণ লোকদের একটি গ্রুপ প্রতিষ্ঠা করেছে।

এক বছরেরও বেশি সময় কাজ করার পরে, এবং মাত্র অর্ধেক ডাটাবেস পরিষ্কার করার পরে, তারা প্রচেষ্টাটিকে পুনরুজ্জীবিত করতে বাহ্যিক ডেটা পরিষ্কারের বিশেষজ্ঞদের অংশ নিতে বেছে নিয়েছিল। পদ্ধতিগতভাবে, প্রতিটি সাইট থেকে তথ্য পরিষ্কার করা হয়েছিল। সমস্ত সাইটের রক্ষণাবেক্ষণ কর্মীদের সংমিশ্রণে, গ্রহণযোগ্য বিশেষ্য/সংশোধক জোড়া সহ পণ্যের বর্ণনার জন্য একটি সাধারণ নকশা ডিজাইন করা হয়েছে; সমস্ত অবস্থান পূরণের জন্য অর্ডার অফ অ্যাট্রিবিউটস আলোচনা করা হয়েছিল; ভাষা, প্রতীক, সংক্ষেপণ এবং ব্যবসায়িক নামকরণে সম্মত হয়েছিল। পুরো ডাটাবেসটি পুনরায় কাজ করতে ছয় মাস সময় লেগেছে।

ভাল ডেটা থাকা এটির সাথে পরিমাণগত পুরষ্কার নিয়ে আসে। সাইটগুলিতে ডুপ্লিকেটগুলি 10 শতাংশ পরিসরে দেখানো হয়েছিল। সাইটগুলি জুড়ে ঘন ঘন আইটেমগুলি 25% পরিসরে চিহ্নিত করা হয়েছিল। তিনটি আঞ্চলিক স্টোরকে কিছু কেন্দ্রীয় গুদামে মার্জ করা মোট স্টকিং স্তর হ্রাস করে এবং ওয়েবসাইটগুলিকে সাধারণ সমালোচনামূলক অতিরিক্ত ভাগ করে নেওয়ার অনুমতি দেয়। এটি কয়েক হাজার অর্থ সাশ্রয়েও মুক্তি পেয়েছে।

আইটেম অনুসন্ধানগুলি সফলভাবে অংশের তথ্য প্রদর্শন করেছে যা রক্ষণাবেক্ষণ কর্মচারীদের উপর নির্ভর করতে পারে। মৌলিক স্টোরগুলির প্রতি আস্থা বাড়ার সাথে সাথে বেসরকারী ক্যাশে থেকে অতিরিক্ত তালিকা প্রত্যাবাসন করা হয়েছিল, আরও সেভিংসকে উপলব্ধি করা হয়েছিল। সামগ্রিকভাবে, ব্যবসা জুড়ে, স্টক 20%এর বেশি হ্রাস পেয়েছিল।

ডেটা ক্লিনআপ প্রচেষ্টা স্পষ্টভাবে নিজের জন্য বেশ কয়েকবার অর্থ প্রদান করেছে। এটি অন্যান্য কর্পোরেট উদ্যোগের প্রেরণাও হয়ে ওঠে। রক্ষণাবেক্ষণ ব্যবস্থাকে আরও উন্নত করতে ব্যবসায়টি তার আইটেম-সরঞ্জাম সংযোগগুলি বাড়িয়ে তোলে। অতিরিক্তভাবে, এটি পণ্য লাইনের সাথে আইটেমগুলিকে একীভূত করে এবং ভলিউম ছাড়ের জন্য তার সরবরাহকারী বেসকে হ্রাস করে।

স্পষ্টতই দুর্দান্ত ডেটা দুর্দান্ত ফলাফল দেয়।