Подписка на блог

Customize in /user/extras/follow-sheet.tmpl.php.

Sample text.

Twitter, Facebook, VK, Telegram, LinkedIn, Odnoklassniki, Pinterest, YouTube, TikTok, РСС JSON Feed

Sample text.

Про интернет-маркетинг, путешествия и автомобили Telegram-канал

Хеширование данных для Яндекс

Кейс работы с AI ChatGPT

Хеширование данных для Яндекс
кейс работы с AI

Задача: хешировать данные о покупателях и передать в Яндекс для мэтчинга. Данные о покупателях в моём случае в двух столбцах таблицы XLSX: номер телефона и дата покупки. В Яндекс нужно передать TXT файл с хешированными данными по алгоритму MD5.

Решение: скрипт на Python от ChatGPT. Скачать скрипт с Google Drive вместе с примером исходных данных.

import pandas as pd
import hashlib

# Считайте данные из Excel
df = pd.read_excel('D:\\Проекты\\проект\\хэшер\\Данные о покупателях.xlsx')

# Хешируйте данные
def hash_data(data):
    hashed_data = []
    for index, row in df.iterrows():
        hashed_row = []
        for value in row:
            hashed_value = hashlib.md5(str(value).encode()).hexdigest()
            hashed_row.append(hashed_value)
        hashed_data.append(hashed_row)
    return hashed_data

hashed_data = hash_data(df)

# Формируйте хеш-строку
def form_hash_string(hashed_data):
    hash_string = ''
    for row in hashed_data:
        for value in row:
            hash_string += value + ','
        hash_string = hash_string[:-1] + '\n'
    return hash_string

hash_string = form_hash_string(hashed_data)

# Сохраните хеш-строку в файл
with open('D:\\Проекты\\проект\\хэшер\\Данные о покупателях MD5.txt', 'w') as f:
    f.write(hash_string)

Комментарии: В скрипте hash.py указываете путь к источнику данных таблицы XLSX и путь по которому нужно сохранить данные в хешированном виде в файле с расширением TXT. При необходимости можно сменить алгоритм хеширования с MD5 на SHA-256.

Какие данные доступны после мэтчинга
Получившийся файл передал менеджеру Яндекса для мэтчинга данных рекламной кампании в Яндекс Бизнес. Через несколько дней получил от Яндекса таблицу с данными:

  • Срок — Период, за который делаем мэтчинг хешей.
  • Сумма за период (до НДС) — сколько было потрачено на рекламу за период.
  • Кол‑во записей — сколько хешей было в файле клиента.
  • Кол‑во совпадений — сколько хешей нашлось в системе.
  • Сумма совпадений — сумма покупок по тем пользователям, которые совпали по файлу клиента.
  • Ср. чек — средний чек клиента за период работы рекламы.
  • ДРР — показатель, отражающий отношение рекламных расходов к доходам от этой рекламы.
  • % авторизованных от общего числа — процент пользователей, которые пользуются версиями Карт будучи авторизованными.
  • Кол‑во авторизованных от общего числа — показываем, сколько авторизованных пользователей было из тех, которые выслал клиент.
  • % авторизованных с записью — показываем процент авторизованных пользователей, которые совершили покупку.
  • Кол‑во авторизованных с записью — показываем, сколько авторизованных пользователей совершили покупку.

ДРР или данных по среднему чеку может и не быть, всё зависит от того какими данными с вами поделился клиент и что вы передали в Яндекс.

Без привлечения ресурсов разработчика, без знаний Phyton и с помощью ChatGPT решил небольшую задачу. Продолжаю перестраивать работу в интернет-маркетинге, чтобы осознать возможности AI и больше использовать искусственный интеллект в разных задачах. Решение от DeepSeek пока не изучал.

Может пригодиться: