量子双生影

还是蛮简单的，考了一个ntfs，image combiner，二维码。

先用7z打开rar，会发现另一张图片，解压一下，得到总共两张图片

两张图片stegsolve，image combiner一下，得到这个

用支付宝扫一下就出了（扫不出的话调整下视角）

PaperBack

网上搜索一下就可以发现是利用程序将电脑内容打印到纸上的，我们现在有了这个纸上的内容，需要返回到电脑的内容

在github里搜关键词paperbake可以搜到https://github.com/timwaters/paperback ，然后找到官网https://www.ollydbg.de/Paperbak/

下载后将图片拖进去就可以得到一个flag.ws

打开发现是空格tab隐写

手敲一下忽略掉最前面的00000得到

转换ascii得到flag：L3HCTF{welcome_to_l3hctf2025}

LearnRag

RAG泄露，附件给了嵌入向量

原本想相似性查询去爆的，但是都是些无意义的字符

转变思路为向量逆向，用工具vec2text

import pickle
import torch
import numpy as np


def solve_with_vec2text():
    """使用vec2text库逆向RAG embedding"""
    print("🚀 使用vec2text库解决RAG embedding逆向问题")
    print("="*60)

    # 步骤1: 安装vec2text库
    print("📦 步骤1: 确保vec2text库已安装")
    try:
        import vec2text
        print("✅ vec2text库已安装")
    except ImportError:
        print("❌ vec2text库未安装，请运行: pip install vec2text")
        print("🔧 安装命令:")
        print("   pip install vec2text")
        return

    # 步骤2: 加载RAG数据（解决pickle问题）
    print("\n📂 步骤2: 加载RAG数据")

    # 创建虚拟RagData类
    class RagData:
        def __init__(self):
            pass

    # 注册到全局命名空间
    import __main__
    __main__.RagData = RagData
    globals()['RagData'] = RagData

    try:
        with open('rag_data.pkl', 'rb') as f:
            rag_data = pickle.load(f)

        print("✅ RAG数据加载成功")

        if hasattr(rag_data, 'embedding_model'):
            print(f"   模型: {rag_data.embedding_model}")

        if hasattr(rag_data, 'embeddings'):
            embeddings = np.array(rag_data.embeddings)
            print(f"   向量数量: {len(embeddings)}")
            print(
                f"   向量维度: {embeddings.shape[1] if len(embeddings.shape) > 1 else '?'}")
        else:
            print("❌ 未找到embeddings数据")
            return

    except Exception as e:
        print(f"❌ 加载RAG数据失败: {e}")
        return

    # 步骤3: 加载GTR corrector模型
    print("\n🤖 步骤3: 加载vec2text的GTR corrector模型")

    try:
        # 根据vec2text文档，加载预训练的GTR corrector
        corrector = vec2text.load_pretrained_corrector("gtr-base")
        print("✅ GTR corrector模型加载成功")
    except Exception as e:
        print(f"❌ 加载corrector失败: {e}")
        print("🔧 尝试其他加载方式...")

        try:
            # 尝试手动加载模型
            inversion_model = vec2text.models.InversionModel.from_pretrained(
                "jxm/gtr__nq__32")
            corrector_model = vec2text.models.CorrectorEncoderModel.from_pretrained(
                "jxm/gtr__nq__32__correct")
            corrector = vec2text.load_corrector(
                inversion_model, corrector_model)
            print("✅ 手动加载corrector成功")
        except Exception as e2:
            print(f"❌ 手动加载也失败: {e2}")
            print("📋 可能需要先下载模型或使用其他方法")
            return

    # 步骤4: 转换embedding格式
    print("\n🔄 步骤4: 转换embedding格式")

    # 将numpy数组转换为torch tensor
    embeddings_tensor = torch.tensor(embeddings, dtype=torch.float32)

    # 如果有GPU，移动到GPU
    if torch.cuda.is_available():
        embeddings_tensor = embeddings_tensor.cuda()
        print("✅ 使用GPU进行逆向")
    else:
        print("⚠️ 使用CPU进行逆向（可能较慢）")

    print(f"   Tensor形状: {embeddings_tensor.shape}")

    # 步骤5: 执行逆向重建
    print("\n🎯 步骤5: 执行embedding逆向重建")

    reconstructed_texts = []

    print("🔍 开始逐个重建文本...")

    for i, embedding in enumerate(embeddings_tensor):
        try:
            print(f"   处理向量 #{i+1}/{len(embeddings_tensor)}")

            # 为单个embedding添加batch维度
            single_embedding = embedding.unsqueeze(0)

            # 使用vec2text进行逆向重建
            # 使用更多步数和更大的beam width获得更好结果
            reconstructed = vec2text.invert_embeddings(
                embeddings=single_embedding,
                corrector=corrector,
                num_steps=20,  # 增加步数提高质量
                sequence_beam_width=4  # 使用beam search
            )

            reconstructed_text = reconstructed[0] if reconstructed else ""
            reconstructed_texts.append(reconstructed_text)

            print(f"      重建文本: '{reconstructed_text}'")

            # 检查是否包含flag
            if "L3HCTF" in reconstructed_text or "flag" in reconstructed_text.lower():
                print(f"      🎉 发现疑似flag: {reconstructed_text}")

        except Exception as e:
            print(f"      ❌ 向量#{i+1}逆向失败: {e}")
            reconstructed_texts.append("")

    # 步骤6: 分析结果
    print(f"\n📊 步骤6: 分析重建结果")

    print("🔍 所有重建的文本:")
    for i, text in enumerate(reconstructed_texts):
        if text.strip():
            print(f"   向量#{i+1}: {text}")

            # 检查各种flag模式
            text_lower = text.lower()
            if any(keyword in text_lower for keyword in ['l3hctf', 'flag', 'ctf']):
                print(f"      🎯 可能的flag内容!")

    # 寻找最可能的flag
    potential_flags = []
    for text in reconstructed_texts:
        if text and ("L3HCTF{" in text or "flag{" in text or "ctf{" in text):
            potential_flags.append(text)

    if potential_flags:
        print(f"\n🏆 发现潜在flag:")
        for flag in potential_flags:
            print(f"   🎉 {flag}")
    else:
        print(f"\n🤔 未发现明显的flag格式，但重建的文本可能包含线索")
        print(f"📋 重建文本汇总:")
        for i, text in enumerate(reconstructed_texts):
            if text.strip():
                print(f"   {i+1}. {text}")

    return reconstructed_texts


def alternative_vec2text_approach():
    """备用的vec2text方法"""
    print("\n🔄 备用方法: 简化的vec2text逆向")
    print("="*50)

    try:
        import vec2text

        # 如果主要方法失败，尝试更简单的方法
        print("🔧 尝试简化的逆向方法...")

        # 加载数据
        class RagData:
            pass

        import __main__
        __main__.RagData = RagData

        with open('rag_data.pkl', 'rb') as f:
            rag_data = pickle.load(f)

        embeddings = torch.tensor(rag_data.embeddings, dtype=torch.float32)

        # 尝试不同的corrector
        try:
            corrector = vec2text.load_pretrained_corrector(
                "text-embedding-ada-002")
            print("✅ 使用OpenAI embedding corrector")
        except:
            print("❌ 无法加载预训练模型")
            return

        # 简单逆向，每个向量单独处理
        for i, emb in enumerate(embeddings):
            try:
                result = vec2text.invert_embeddings(
                    embeddings=emb.unsqueeze(0),
                    corrector=corrector,
                    num_steps=5
                )
                print(f"向量#{i+1}: {result[0] if result else 'N/A'}")
            except Exception as e:
                print(f"向量#{i+1}失败: {e}")

    except Exception as e:
        print(f"备用方法也失败: {e}")


if __name__ == "__main__":
    # 先尝试主要方法
    texts = solve_with_vec2text()

    # 如果主要方法失败，尝试备用方法
    if not texts or not any(texts):
        alternative_vec2text_approach()

通过代码可知系统使用ShuffleNet V2模型提取人脸特征向量，通过比较用户上传图像与预存特征向量的差异（MSE < 5e-6）进行身份验证。附件中已有特征向量文件embedding.json,而模型特征向量可被逆向工程生成匹配图像。有两个方向，一个是用特征反演生成图像；一个是上传特征向量注入的假图等伪造手法。

但是我目前的伪造手法都无法通过系统的要求，可能有大佬可以。以下是我的特征反演代码：

（精简版）注意最后要使用png格式保存，因为jpg是有损压缩。

import torch
import torch.optim as optim
from torchvision import transforms
from torchvision.models import shufflenet_v2_x1_0
from PIL import Image
import json

# 1. 加载模型和目标特征向量
model = shufflenet_v2_x1_0(pretrained=True)
model.fc = torch.nn.Identity()  # 只提取特征
model.eval()

with open("embedding.json", "r") as f:
    target_embedding = torch.tensor(json.load(f)).unsqueeze(0)

# 2. 初始化可优化图像
input_img = torch.nn.Parameter(
    torch.rand(1, 3, 224, 224) * 0.5 + 0.25,  # 中灰色范围初始化
    requires_grad=True
)

# 3. 设置优化器
optimizer = optim.Adam([input_img], lr=0.05)

# 4. 优化循环
for i in range(1500):
    optimizer.zero_grad()
    
    # 生成特征向量
    generated_embedding = model(input_img)
    
    # 计算损失（均方误差）
    loss = torch.mean((target_embedding - generated_embedding) ** 2)
    
    # 反向传播
    loss.backward()
    optimizer.step()
    
    # 约束像素值在[0,1]范围
    input_img.data.clamp_(0, 1)
    
    # 每100次迭代打印进度
    if i % 100 == 0:
        print(f"Iteration {i}, Loss: {loss.item():.8f}")
    
    # 提前终止条件
    if loss.item() < 1e-6:
        print(f"Success at iteration {i}!")
        break

# 5. 保存生成的图像（关键：使用PNG无损格式）
output_img = transforms.ToPILImage()(input_img.squeeze(0).detach())
output_img.save("solution.png", format="PNG")
print("Successfully generated solution.png")