Remove replay_data_copy job and simplify sync (!967) · Merge requests · hive / hivemind

Summary

Deleted replay_data_copy job - was duplicating work that sync already does
Simplified sync before_script:
- Initialize HAF submodule (recursive for nested hive submodule)
- Fetch HAF cache from NFS if needed via cache-manager
- Use copy_datadir.sh for data copy (handles permissions properly)
Updated dependent jobs:
- cleanup_pipeline_cache: removed replay_data_copy from needs
- e2e_benchmark_on_postgrest: removed replay_data_copy from needs, removed unused HIVED_UID

The previous flow had:

Now (like balance_tracker):

Pipeline will verify the refactored flow works correctly.