Architect, build, test, deploy distributed, scalable, and resilient Spark/Scala/Kafka Big Data processing, and Machine Learning model pipelines for batch, micro-batch, and streaming workloads sets into Cerebri AI’s proprietary data stores for use in machine learning modeling
Develop and maintain data ontologies for key market segments
Collaborate with data scientists to develop automated orchestration of model pipelines to solve Cerebri AI business use case objectives
Collaborate with clients to develop pipeline infrastructure, and to ask appropriate questions to gain deep understanding of client data
Deploy fully containerized Docker/Kubernetes Data processing, and Machine Learning model pipelines into Azure, AWS, GCP cloud environments and on-premise systems as necessary
Document Detailed Designs (including source to target mappings) and Code for Data Quality frameworks that can measure and maintain Data Completeness, Data Integrity and Data Validity between interfacing systems
Ensure all solutions comply with the highest levels of security, privacy, and data governance requirements as outlined by Cerebri and Client legal and information security guidelines, law enforcement, and privacy legislation, including data anonymization, encryption, and security in transit and at rest, etc.
Qualifications
A degree in Computer Science, Engineering, AI, Machine Learning, BI, MIS, or an equivalent technology field
Minimum 2 years of Production programming experience in Scala, Spark, PySpark, Big Data, Python
Able to program and understand data science and data engineering ideas in Python and translate into modular, functional components in Scala
Proficiency with Linux/Unix operating systems, utilities and tools
Experience working directly with relational database structures and flat files
Ability to write efficient database queries, functions and views to include complex joins and the identification and development of custom indices
Knowledge of professional software engineering practices and best practices for the full software development life cycle, including coding standards, code reviews, source control management, build processes, testing, continuous integration and development, and operations.
Experience with Microsoft Azure or similar cloud computing solutions
Big Data application architecture experience and in-depth understanding of the Big Data ecosystem, applications, services, and design patterns
Nice to Haves
Experience in business intelligence visualization tools such as Grafana, Superset, Redash or Tableau.
Master’s degree or higher in a relevant quantitative subject
Experience with the Atlassian suite (JIRA, Confluence, BitBucket).
Any other related experience with Big Data, artificial intelligence, natural language processing, machine learning and/or deep learning, predictive analytics
Familiar with automated machine learning (AutoML) concepts would be an asset
معرفی شرکت
شرکت «همراه اول» همواره در ساخت تجربههای نوین و کاربردی پیشرو بوده است. این شرکت در راستای توسعه فناوریهای دیجیتال و خلق خدمات مبتنی بر تکنولوژی با تاسیس شرکت «همراه کسب و کارهای هوشمند» کوشیده است تا بستری برای رشد و توسعه صنعت دیجیتال در ایران را فراهم کند.
شرکت «همراه کسب و کارهای هوشمند» در تلاش است تا با بهرهگیری از نوآوریها، متخصصان خلاق و دانش فنی پیشرفته، تجربه زندگی دیجیتال منحصربهفردی را برای همه ایرانیان فراهم آورد.
ما باور داریم که با توسعه تکنولوژی و بهرهگیری از آن است که میتوان محدودیتها را شکست داد، کسب و کارهای تازهای راهاندازی کرد و ایدههای خلاق را به ثمر رساند.
ما تلاش میکنیم برای مشتریان خود، تجربهای تازه از فضای دیجیتال بسازیم تا همه افراد بتوانند به سادهترین و کاربردیترین شکل، پاسخی برای تمام نیازهای زندگی خود بیابند.
اگر به فناوری و جهان گسترده دیجیتال علاقه دارید، آماده شروع یک چالش جدید هستید، به همکاری با یک شرکت بزرگ علاقهمند هستید، نتیجهبخشی پشتکار و تلاش را باور دارید و از یاد گرفتن همراه با کار کردن لذت میبرید... ما مشتاقانه منتظر دریافت رزومه شما هستیم.